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Vorwort. 


Zweck des vorliegenden Heftes ist eine axiomatische Begründung 
der Wahrscheinlichkeitsrechnung. Der leitende Gedanke des Verfassers 
war dabei, die Grundbegriffe der Wahrscheinlichkeitsrechnung, welche 
noch unlängst für ganz eigenartig galten, natürlicherweise in die Reihe 
der allgemeinen Begriffsbildungen der modernen Mathematik ein- 
zuorunen. Vor der Entstehung der LEBESGUEschen Maß- und Inte- 
grationstheorie war diese Aufgabe ziemlich hoffnungslos. Nach den 
LEBESGUEschen Untersuchungen lag die Analogie zwischen dem Maße 
einer Menge und der Wahrscheinlichkeit eines Ereignisses sowie zwischen 
dem Integral einer Funktion und der mathematischen Erwartung 
einer zufälligen Größe auf der Hand. Diese Analogie ließ sich auch 
weiter fortführen: so sind z. B. mehrere Eigenschaften der unabhängigen 
zufälligen Größen den entsprechenden Eigenschaften der orthogonalen 
Funktionen völlig analog. Um, ausgehend von dieser Analogie, die 
Wahrscheinlichkeitsrechnung zu begründen, hätte man noch die MaB- 
und Integrationstheorie von den geometrischen Elementen, welche bei 
LEBESGUE noch hervortreten, zu befreien. Diese Befreiung wurde von 
FRECHET vollzogen. 

Der diesen allgemeinen Gesichtspunkten entsprechende Aufbau der 
Wahrscheinlichkeitsrechnung war in den betreffenden mathematischen 
Kreisen seit einiger Zeit geläufig; es fehlte jedoch eine vollständige 
und von überflüssigen Komplikationen freie Darstellung des ganzen 
Systems (es befindet sich allerdings ein Buch von FRECHET (Literatur- 
verzeichnis [2]) in Vorbereitung). 

Ich möchte hier noch auf diejenigen Punkte der weiteren Darstel- 
lung hinweisen, welche außerhalb des erwähnten, den Kennern ver- 
trauten Ideenkreises liegen. Diese Punkte sind die folgenden: Wahr- 
scheinlichkeitsverteilungen in unendlich-dimensionalen Räumen (drittes 
Kap., 84), Differentiation und Integration der mathematischen Er- 
wartungen nach einem Parameter (viertes Kap., $5), vor allem aber 
die Theorie der bedingten Wahrscheinlichkeiten und Erwartungen 
(fünftes Kap.). Es sei dabei hervorgehoben, daß diese neuen Frage- 
stellungen notwendigerweise aus einigen ganz konkreten physikalischen 
Fragestellungen entstanden sind!. 


ı Vgl. z.B. die in der Fußnote 1 auf der S. 41 zitierte Arbeit von Herrn LEONTO- 
WITSCH und dem Verfasser sowie M. LEONTOWITSCH: Zur Statistik der kontinuier- 
lichen Systeme und des zeitlichen Verlaufes der physikalischen Vorgänge. Phys. 
Z. Sowjetunion Bd. 3 (1933) S. 35 — 63. 
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Das sechste Kapitel enthält eine Übersicht (ohne Beweise) einiger 
Resultate von Herrn KHINTCHINE und dem Verfasser über die Anwend- 
barkeitsgrenzen des gewöhnlichen und des starken Gesetzes der großen 
Zahlen. In dem Literaturverzeichnis sind einige neuere Arbeiten an- 
gegeben, welche vom Standpunkte der Grundlagenfragen von Interesse 
sein dürften. 

Herrn A. KHINTCHINE, der das ganze Manuskript sorgfältig durch- 
gelesen und dabei mehrere Verbesserungen vorgeschlagen hat, danke 
ich an dieser Stelle herzlich. 


Kljasma bei Moskau, Ostern 1933. 
A. KOLMOGOROFF. 
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Erstes Kapitel. 


Die elementare 
Weahrscheinlichkeitsrechnung. 


Wir nennen elementare Wahrscheinlichkeitsrechnung denjenigen 
Teil der Wahrscheinlichkeitsrechnung, in welchem Wahrscheinlichkeiten 
von nur endlich vielen zufälligen Ereignissen vorkommen. Die Sätze, 
die hier gewonnen werden, werden natürlich angewandt auch auf Fragen, 
die mit unendlich vielen zufälligen Ereignissen verbunden sind, aller- 
dings braucht man bei der Behandlung dieser letzteren Fragen auch 
wesentlich neue Prinzipien. Deshalb wird ein sich gerade auf den Fall 
unendlich vieler zufälliger Ereignisse beziehendes Axiom der mathe- 
matischen Wahrscheinlichkeitstheorie erst zu Beginn des zweiten Kapitels 
eingeführt (Axiom VI). 

Die Wahrscheinlichkeitstheorie als mathematische Disziplin soll und 
kann genau in demselben Sinne axiomatisiert werden wie die Geometrie 
oder die Algebra. Das bedeutet, daß, nachdem die Namen der zu unter- 
suchenden Gegenstände und ihrer Grundbeziehungen sowie die Axiome, 
denen diese Grundbeziehungen zu gehorchen haben, angegeben sind, 
die ganze weitere Darstellung sich ausschließlich auf diese Axiome 
gründen soll und keine Rücksicht auf die jeweilige konkrete Bedeutung 
dieser Gegenstände und Beziehungen nehmen darf. 

Dementsprechend wird im $ 1 der Begriff eines Wahrscheinlichkeits- 
feldes als eines gewissen Bedingungen genügenden Mengensystems defi- 
niert. Was die Elemente dieser Mengen sind, ist dabei für die rein 
mathematische Entwicklung der ‚Wahrscheinlichkeitsrechnung völlig 
gleichgültig (man vgl. die Einführung der geometrischen Grundbegriffe 
in HiILBERTsS „Grundlagen der Geometrie‘‘ oder die Definitionen von 
Gruppen, Ringen und Körpern in der abstrakten Algebra). 

‘Jede axiomatische (abstrakte) Theorie läßt bekanntlich unbegrenzt 
viele konkrete Interpretationen zu. In dieser Weise hat auch die mathe- 
matische Wahrscheinlichkeitstheorie neben derjenigen ihrer Inter- 
pretationen, äus der sie aufgewachsen ist, auch zahlreiche andere. 
Wir kommen so zu Anwendungen der mathematischen Wahrscheinlich- 
keitstheorie auf Untersuchungsgebiete, die mit den Begriffen des Zu- 
falls und der Wahrscheinlichkeit im konkreten Sinne dieser Begriffe 
nichts zu tun haben. Derartigen Anwendungen ist der Anhang ge- 
widmet. | 
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Die Axiomatisierung der Wahrscheinlichkeitsrechnung kann auf ver- 
schiedene Weisen geschehen, und zwar beziehen sich diese verschiedenen 
Möglichkeiten sowohl auf die Wahl der Axiome als auch auf die der 
Grundbegriffe und Grundrelationen. Wenn man allerdings das Ziel 
der möglichen Einfachheit des Axiomensystems und des weiteren Auf- 
baus der darauf folgenden Theorie im Auge hat, so scheint es am zweck- 
mäßigsten, die Begriffe eines zufälligen Ereignisses und seiner Wahr- 
scheinlichkeit zu axiomatisieren. Es gibt auch andere Begründungs- 
systeme der Wahrscheinlichkeitsrechnung, nämlich solche, bei denen 
der Wahrscheinlichkeitsbegriff nicht zu den Grundbegriffen zählt, 
sondern durch andere Begriffe ausgedrückt wird!. Dabei wird jedoch 
ein anderes Ziel angestrebt, nämlich der größtmögliche Anschluß der 
mathematischen Theorie an die empirische Entstehung des Wahrschein- 
lichkeitsbegriffes. 

$ 1. Axiome®. 

Es sei E eine Menge von Elementen &,n,{,..., welche man elemen- 
tare Ereignisse nennt, und % eine Menge von Teilmengen aus E; die 
Elemente der Menge % werden weiter zufällige Ereignisse genannt. 

1. % ist ein Mengenkörper®. 
II. % enthält die Menge E. 

III. Jeder Menge A aus 75 ıst eine nichtnegative reelle Zahl P(A) 
zugeordnet. Diese Zahl P(A) nennt man die Wahrscheinlichkeit des 
Ereignisses A. 

IV. P(E) =1. 

V. Wenn A und B disjunkt sind, so gılt 

P(A+B)=P(A)+P(B). 

Ein Mengensystem % mit einer bestimmten Zuordnung der Zahlen 
P(A), welche den Axiomen I—V genügt, nennt man ein Wahrscheinlich- 
keitsfeld. 

Unser Axiomensystem I—V ist widerspruchsfrei. Das zeigt folgendes 
Beispiel: E besteht aus einem einzigen Elemente $, % aus E und der 
Nullmenge 0, wobei P(E) = 1, P(0) = 0 gesetzt ist. 

ı Vgl. z.B. R.von Miıses [1] und [2] und S. BERNSTEIN [1]. 

3 Ein Leser, der den folgenden Axiomen sofort einen konkreten Sinn geben 
will, soll sogleich den $ 2 lesen. 

3 Vgl. HausporrFF: Mengenlehre 1927 S. 78. Ein Mengensystem heißt ein 
Körper, wenn Summe Durchschnitt und Differenz von zwei Mengen des Systems 
wieder dem System angehören. Jeder nicht leere Mengenkörper enthält die Null- 
menge O0. Wir bezeichnen mit HAUSDORFF den Durchschnitt von A und B mit 
AB, die Vereinigungsmenge von A und B im Falle AB = O mit A + B, allgemein 
aber mit A + B, und die Differenz von A und B mit A -- B. Das Komplement 
E — A der Menge A wird durch A bezeichnet. Die elementaren Rechengesetze 
für Mengen und ihre Durchschnitte, Summen und Differenzen werden weiter als 


bekannt vorausgesetzt. Mengen aus {5 werden weiter mit großen lateinischen 
Buchstaben bezeichnet. 
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Unser Axiomensystem ist aber wnvollständig: in verschiedenen 
Problemen der Wahrscheinlichkeitsrechnung betrachtet man verschie- 
dene Wahrscheinlichkeitsfelder. | 

Konstruktion von Wahrscheinlichkeitsfeldern. Einfachste Wahrschein- 
lichkeitsfelder konstruiert man folgendermaßen: ‘Man nimmt eine be- 
liebige endliche Menge E = {£,, &,,.. ., &} und eine beliebige Menge 
{Pı, Pa, .,.Dpx} von nichtnegativen Zahlen mit der Summe , + Ps 
+..-+9=1, als % nimmt man die Gesamtheit aller Untermengen 
von E und setzt P{&,,8..:--&=d,+Pu+'"-+2u,. Man 
sagt in diesem Falle, daß #,, s, - . -, ? die Wahrscheinlichkeiten der 
elementaren Fälle &,, &,,...,&, oder die elementaren Wahrscheinlich- 
keiten sind. So erhält man alle möglichen endlichen Wahrscheinlich- 
keitsfelder mit der Gesamtheit aller Untermengen von E als % (man 
nennt dabei ein Wahrscheinlichkeitsfeld endlich, wenn: die Menge E 
endlich ist). Für weitere Beispiele vgl. zweites Kapitel, $ 3. 


$& 2. Das Verhältnis zur Erfahrungswelt'!. 


Die Anwendung der Wahrscheinlichkeitsrechnung auf die reelle Er- 
fahrungswelt geschieht nach dem folgenden Schema: 

1. Es wird ein gewisser Komplex © von Bedingungen vorausgesetzt, 
welcher unbeschränkter Wiederholung fähig ist. 

2. Man untersucht einen bestimmten Kreis von Ereignissen, welche 
infolge der Realisation der Bedingungen © entstehen können. In den 
einzelnen Fällen der Realisation der Bedingungen © verlaufen die 
erwähnten Ereignisse im allgemeinen auf verschiedene Weisen. Es 
sei E die Menge der verschiedenen möglichen Varianten: &,,&,,.-. 
des Verlaufes der besagten Ereignisse. Einige unter diesen Yarianten 
brauchen dabei überhaupt nicht zur Realisation zu gelangen. Wir 
nehmen in die Menge E alle Varianten auf, die wir a priori für möglich 
erachten. 

3. Wenn die nach der Realisation der Bedingungen © praktisch 
aufgetretene Variante unserer Ereignisse zu der (durch irgendwelche 
Bedingungen definierten) Menge A gehört, so sagen. wir, daß das Er- 
eignis A stattgefunden hat. 

ı Ein Leser, der sich nur für die rein mathematische Entwicklung der Theorie 
interessiert, braucht diesen Paragraphen nicht zu lesen — die weitere Darstellung 
beruht auf den Axiomen des $ 1 und benutzt nicht die Überlegungen des gegen- 
wärtigen Paragraphen. In diesem wollen wir uns mit dem bloßen Hinweis auf 
die empirische Entstehung der Axiome der Wahrscheinlichkeitsrechnung begnügen 
und lassen deshalb eine eingehende philosophische Untersuchung des Wahrschein- 
lichkeitsbegriffes in der Erfahrungswelt bewußt beiseite. In der Darstellung der 
notwendigen Voraussetzungen für die Anwendbarkeit der Wahrscheinlichkeits- 
rechnung auf die Welt der reellen Geschehnisse folgt der Verfasser im hohem Maße 
den Ausführungen von Herrn von Mises (vgl. insbesondere [1] S. 21—27: „Das 
Verhältnis der Theorie zur Erfahrungswelt‘‘). 
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Beispiel. Der Komplex der Bedingungen © besteht darin, daß 
man zweimal eine Münze wirft. Der Kreis von Ereignissen, von dem 
unter 2. die Rede war, besteht darin, daß bei jedem Wurf der Kopf 
bzw. der Adler zum Vorschein kommt. Dafaus folgt, daß im ganzen 
vier verschiedene Varianten (Elementarereignisse) möglich sind, nämlich 


Kopf— Kopf, Kopf—Adler, Adler—Kopf, Adler— Adler. 


Als Ereignis A betrachte man eine Wiederholung. Dieses Ereignis 
besteht aus dem Inbegriff des ersten und vierten Elementarereignisses. 
Man kann also jedes Ereignis als Menge von Elementarereignissen be- 
trachten. 

4. Unter gewissen Bedingungen, auf die wir hier nicht näher ein- 
gehen wollen, kann man voraussetzen, daß einem Ereignis A, welches 
infolge der Bedingungen A auftritt oder nicht, eine gewisse reelle Zahl 
P(A) zugeordnet ist, welche folgende Eigenschaften besitzt: 

A. Man kann praktisch sicher sein, daß, wenn man den Komplex 
der Bedingungen © eine große Anzahl von » Malen wiederholt und 
dabei durch m die Anzahl der Fälle bezeichnet, bei denen das Ereignis A 
stattgefunden hat, das Verhältnis m/n sich von P(A) nur wenig unter- 
scheidet, 

B. Ist P(A) sehr klein, so kann man praktisch sicher sein, daß bei 
einer einmaligen Realisation der Bedingungen © das Ereignis A nicht 
stattfindet. 

Empirische Deduktion der Axiome. Gewöhnlich kann man voraus- 
setzen, daß das System % der in Betracht kommenden Ereignisse 
A,B,C,..., denen gewisse Wahrscheinlichkeiten zugeschrieben sind, 
einen Mengenkörper bildet, welcher E als Element enthält (Axiome I 
und II sowie die erste Hälfte des Axiomes III — die Existenz der 


Wahrscheinlichkeiten). Es ist ferner evident, daß stets 0S”<1 ist, 


so daß die zweite Hälfte des Axioms III durchaus als natürlich er- 
scheint. Für das Ereignis E gilt immer m = r, weshalb man natürlicher- 
weise P(E) =1 setzt (Axiom IV). Sind schließlich A und B mit- 
einander unverträglich (d.h. sind die Mengen A und B disjunkt), so 
ist m = m, + Ms, wobei m, m,,m, der Reihe nach die Anzahl der 
Versuche bezeichnet, in denen das Ereignis A + B bzw. A bzw. B 
auftritt. Daraus folgt 

m mM ,: m, 

nn nm 


Es erscheint also als angebracht, P(4 +B) = P(A)+P(B) zu setzen. 

Bemerkung I. Aus der praktischen Sicherheit zweier Behaup- 
tungen folgt die praktische Sicherheit der Behauptung ihrer gleich- 
zeitigen Richtigkeit, obwohl der Sicherheitsgrad sich dabei ein wenig 
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erniedrigt. Ist jedoch die Anzahl der Behauptungen sehr groß, so lassen 
sich aus der praktischen Sicherheit jeder einzelnen dieser Behauptungen 
in bezug auf die Richtigkeit der simultanen Behauptung überhaupt 
keine Schlüsse ziehen. Deshalb folgt aus dem Prinzip A noch keines- 
wegs, daß bei einer sehr großen Anzahl von Serien von Versuchen, von 
denen jede Serie aus » Versuchen besteht, in jeder Serie der Quotient 
m/n sich von P(A) wenig unterscheiden wird. | 

Bemerkung Il. Dem unmöglichen Ereignis (der leeren Menge) 
entspricht kraft unserer Axiome die Wahrscheinlichkeit P(0) =0*, 
während umgekehrt aus P(A) = 0 die Unmöglichkeit des Ereignisses A 
durchaus nicht zu folgen braucht; nach dem Prinzip B folgt aus dem 
Nullwerden der Wahrscheinlichkeit nur, daß bei einer einmaligen 
Realisation der Bedingungen © das Ereignis A praktisch unmöglich 
ist. Das bedeutet jedoch keineswegs, daß auch bei einer genügend 
langen Reihe von Versuchen das Ereignis A nicht auftreten wird. 
Andererseits kann man nach dem Prinzip A_ nur behaupten, daß bei 
P(A) = 0 und sehr großem rn der Quotient m/n sehr klein wird (er 
kann z.B. gleich 1/r sein). 


.& 3. Terminologische Vorbemerkungen. 


Wir haben die eigentlichen Objekte unserer weiteren Betrachtungen 
— die zufälligen Ereignisse — als Mengen definiert. Mehrere mengen- 
theoretische Begriffe bezeichnet man aber in der Wahrscheinlichkeits- 
rechnung mit anderen Namen. Wir wollen hier ein kurzes Verzeichnis 
solcher Begriffe geben. 


M engentheoretisch. Im Falle der zufälligen Ereignisse. 
1.A und B sind disjunkt, d.h. 4. Die Ereignisse A und B sind 
AB=0. unvereinbar. 
2. AB...N=0. 2. Die Ereignise A, B,..., N 
sind unvereinbar. 
3.AB...N=X. 3. Das Ereignis X besteht in der 


gleichzeitigen Realisation aller 

Ereignisse A,B,...,N. 
4. A{B-{:.:.:-IN=X. 4. DasEreignis X besteht in derEr- 
scheinung mindestens eines un- 
5 ter den Ereignissen A,B,...,N. 
5. Die Komplementärmenge A. 5. Das entgegengesetzte Ereignis 
A besteht in der Nichterschei- 

nung des Ereignisses A. 

0. 6. A ist unmöglich. 

E. 7. A muß notwendig vorkommen. 


Ma A 
| 


7. 


* Vgl. $ 3, Formel (3). 
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8. Ein System W der Mengen A,, 8. Ein Versuch A besteht darin, 


Ag,..., A, bildet eine Zer- daß man feststellt, welches 
legung der Menge E, wenn unter den Ereignissen A4,, 
A,R+tA,+---+A,=E is Ag, ..., A„ vorkommt. A,, 
(das setzt bereits voraus, daß Ag,..., A, sind die möglichen 
die Mengen A, paarweise dis- Ausgänge des Versuches W. 


junkt sind). 
9. B ist eine Untermenge von A: 9. Aus der Realisation des Er- 
BcA. eignisses B folgt notwendig 
| dieselbe von A. 


8 4. Unmittelbare Folgerungen aus den Axiomen, bedingte 
Wahrscheinlichkeiten, der Satz von Baves. 


Aus A + A=E und den Axiomen IV und V folgt 


(1) P(4) + P(4) =1, 

(2) | P(A)=1—P(A). 

Da E = 0 ist, erhält man insbesondere 

(3) P()=0. 

Wenn A,B,...,N unvereinbar sind, so folgt aus dem Axiom IV die 
Formel | 


(4) PA+B+-+N)=P(A)+P(B) +. +P(N) 
(der Additionssatz). 
Wenn P(A) >0 ist, so nennt man den Quotienten 


P(AB 
(5) P,(B) = a, 


die bedingte Wahrscheinlichkeit des Ereignisses B unter der Bedingung A. 
Aus (5) folgt unmittelbar 


(6) P(AB)=P(A)Pı(B). 
Ein Induktionsschluß ergibt sodann die allgemeine Formel 
(7) P(AıA2... An) = P(A,) Pi (A) Pau (As)... Paar... An-ı (An) 


(der Multiplikationssatz). 
Man beweist auch leicht folgende Formeln: 





(8) P,B>0, 
(9) PA =1, 
(10) PA B+C)=Pi(B) + Pı(C). 


Vergleicht man diese Formeln (8) bis (10) mit den Axiomen III bis V, 
so ergibt sich, daß das Mengensystem 3% mit der Mengenfunktion P,(B) 
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(bei einer festen Menge A) ein Wahrscheinlichkeitsfeld bildet. Folglich 
gelten alle für die Wahrscheinlichkeiten P(B) bewiesenen allgemeinen 
Sätze auch für die bedingten Wahrscheinlichkeiten P,(B) (mit einem 
festen Ereignisse A). Man bemerkt noch leicht, daß 
(11) PA) =1 
ist. 

Aus (6) und der symmetrischen Formel 


P(AB) =P(B)Pz(4) 


ergibt sich die wichtige Formel 


P(A) Pı(B 
(12) Pa(4) = Eu, 


welche eigentlich den Satz von BAyEs enthält. 

Satz über die vollständige Wahrscheinlicheit. Es sei 
A,R,+4A,+---+4A,=E (das setzt voraus, daß die Ereignisse A,, 
A,,..., A, unvereinbar sind) und X beliebig. Dann ist 
(13) PX) =P(A)Pa(R) + PAPA + + PAPA. 

Beweis. 

X=4AX+4X+ ... + A,X, 
nach (4) hat man somit 
P(X) = P(4,%) + P(4A) + + PA), 
nach (6) gilt aber dabei 
P(4A) = P(A)Pu(A). 

Satz vonBayveEs. Essei A, +4, +: +4A,„=E und X beliebig, 

dann gilt 


a A  ——_——__ 
a) TFT PAPA) + PIAJPALD + + P(A) Pa(X) 


ı=1,2,3,...,R. 


Man nennt dabei öfters A,, A,,.. ., A„ ‚Hypothesen‘ und sagt, daß 
die Formel (14) die Wahrscheinlichkeit Py(A,) der Hypothese A, nach 
dem Auftreten des Ereignisses X angibt. [P(A,) wird dabei als die 
Wahrscheinlichkeit a priori von A, bezeichnet.) 

Beweis. Nach der Formel (12) hat man 


P(A,) Pı.(X) 
PA) 
Um die Formel (14) zu gewinnen, bleibt nur die Wahrscheinlichkeit, 


P(X) durch ihren Ausdruck (13) nach dem Satze über die vollständige 
Wahrscheinlichkeit zu ersetzen. 


Pz(4,) = 


8 I. Die elementare Wahrscheinlichkeitsrechnung. [208 


8 5. Unabhängigkeit. 


Der Begriff der gegenseitigen Unabhängtıgkeit zweier oder mehrerer 
Versuche nimmt eine in gewissem Sinne zentrale Stellung in der Wahr- 
scheinlichkeitsrechnung ein. In der Tat haben wir schon gesehen, daß 
die Wahrscheinlichkeitsrechnung vom mathematischen Standpunkte 
aus als eine spezielle Anwendung der allgemeinen Theorie der additiven 
Mengenfunktionen betrachtet werden kann. Man kann sich natürlich. 
fragen, wie ist es dann möglich, daß die Wahrscheinlichkeitsrechnung 
sich in eine große, ihre eigenen Methoden besitzende selbständige 
Wissenschaft entwickelt hat? | 

Diese Frage zu beantworten, heißt die Spezialisierung anzugeben, 
die die allgemeinen Fragestellungen über additive Mengenfunktionen 
in der Wahrscheinlichkeitsrechnung erfahren. 

Der Umstand, daß unsere additive Mengenfunktion P(A) nicht 
negativ ist und der Bedingung P(E) = 1 genügt, bedingt natürlich 
noch keine tiefliegenden eigentümlichen Probleme. Zufällige Größen 
(vgl. drittes Kap.) sind vom mathematischen Standpunkte aus nichts 
anderes als in bezug auf P(A) meßbare Funktionen, während ihre 
mathematischen Erwartungen abstrakte LEBESGUEsche Integrale sind. 
(Diese Analogie wurde zum erstenmal in den Arbeiten von M. FRECHET 
völlig erklärt!.) Die Einführung der genannten Begriffe könnte also 
auch noch keine Basis für die Entwicklung einer großen originellen 
Theorie liefern. 

Geschichtlich ist die Unabhängigkeit von Versuchen und zufälligen 
Größen derjenige mathematische Begriff, welcher der Wahrscheinlich- 
keitsrechnung ihr eigenartiges Gepräge gibt. Die klassischen Arbeiten 
von LAPLACE, POISSON, TCHEBYCHEFF, MARKOFF, LIAPOUNOFF, V. MISES 
und BERNSTEIN sind in der Tat im wesentlichen der Untersuchung von 
Reihen unabhängiger Größen gewidmet. Wenn man in den neueren 
Untersuchungen (MARKOFF, BERNSTEIN usw.) öfters die Forderung der 
vollständigen Unabhängigkeit ablehnt, so sieht man sich immer ge- 
zwungen, um hinreichend inhaltreiche Resultate zu erhalten, ab- 
geschwächte analoge Forderungen einzuführen. (Vgl. in diesem Kap. 
$6 — MARrKOFFEsche Ketten.) 

Man kommt also dazu, im Begriffe der Unabhängigkeit wenigstens 
den ersten Keim der eigenartigen Problematik der Wahrscheinlichkeits- 
rechnung zu erblicken — ein Umstand, welcher in diesem Buche nur 
wenig hervortreten wird, da wir hier hauptsächlich nur mit den logischen 
Vorbereitungen zu den eigentlichen wahrscheinlichkeitstheoretischen 
Untersuchungen zu tun haben werden. 

Es ist dementsprechend eine der wichtigsten Aufgaben der Philo- 
sophie der Naturwissenschaften, nachdem sie die vielumstrittene Frage 








ı Vgl. [1] und [2]. 
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über das Wesen des Wahrscheinlichkeitsbegriffes selbst erklärt hat, 
die Voraussetzungen zu präzisieren, bei denen man irgendwelche gegebene 
reelle Erscheinungen für gegenseitig unabhängig halten kann. Diese 
Frage fällt allerdings aus dem Rahmen unseres Buches. 


Es seien » Versuche A”, A®,..., X”, d.h. n Zerlegungen 
E=AP+AP+--- +49 =1,2,...,n 


der Grundmenge E gegeben. Im allgemeinen kann man r =r,r,...7, 
Wahrscheinlichkeiten 


Daa.. = P(Ay A Au. . An) =0 
beliebig unter der einzigen Bedingung 
(1) q zZ. Da: da... Qu — 1 


wählen!. 
Definition I. Man nennt » Versuche A, y2,..., A) gegenseitig 
unabhängig, wenn bei beliebigen g,, 4, - - -, 9 die Gleichung 


2 P(aWAD... am) =P(AW)P(AB)... P(ai) 
gilt. 
Man hat unter den r Gleichungen (2) nur rn -— nn — ---—r, 


+ — 1 unabhängige®. 

SatzI. Wenn » Versuche XP, A®,..., A® gegenseitig unabhängig 
sind, so sind auch irgendwelche m (m < n) Versuche X, YW,,. ., m) 
unter ihnen unabhängig®. 


ı Man konstruiert ein Wahrscheinlichkeitsfeld mit beliebigen, nur den er- 
wähnten Bedingungen unterworfenen Wahrscheinlichkeiten 94,4... qu folgender- 
maßen: die Menge E bestehe aus r Elementen £,g....qu, die entsprechenden 
elementaren Wahrscheinlichkeiten seien Pug,...qn, endlich sei Aw die Menge 
aller &, 0... mit i=g. | 

% In der Tat kann man im Unabhängigkeitsfalle nur 1, +72 +---+7, 
Wahrscheinlichkeiten p? = P(A 2) beliebig wählen, und zwar unter der Geltung 


von n Bedingungen 
»2 p® 4 
q . 


q 
Man hat also im allgemeinen Falle r — ı Freiheitsgrade und im Falle der Un- 
abhängigkeit nur , +1 +:-- +. —n. 
3 Zum Beweise genügt es, zu zeigen, daß aus der gegenseitigen Unabhängigkeit 
von » Zerlegungen die gegenseitige Unabhängigkeit von » — 1 ersten unter ihnen 
folgt. Es sei also angenommen, daß die Gleichungen (2) erfüllt sind. Dann ist 


P(AV AR... .An.) =ZP(AuAs n, An. 


= P(A®) P(AP)... Pla )ZPlan) = = P(A,)P(4%) .-- PA); 


In-ı 


w. z.b. w. 
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Es gelten folglich im Falle der Unabhängigkeit die Gleichungen 
3) P(An Age... Am) = P(An) P(Am”)... PAR”) 
(i, sollen dabei alle verschieden sein). 


Definition II. » Ereignisse A,,A,,.-., A, sind gegenseitig un- 
abhängig, wenn die Zerlegungen (Versuche) 


E=4,;, +4: | k=1,2,...,n 
unabhängig sind. | 

In diesem Falle ist, == ---=r,=2,17= 2"; es gibt folglich 
unter den 2* Gleichungen (2) nur 2" — » — 4 unabhängige. Die folgen- 
den 2" — n» — 4 Gleichungen sind auch für die Unabhängigkeit der Er- 
eignisse A,, Ag, . . ., A„ notwendig und hinreichend!: 


(4) P(4,A,-. 4) = P(A;) P(A,)- : -P(4;.): 
m—=1,2, n, 
I<u<u<: <insn. 
Diese Gleichungen sind alle gegenseitig unabhängig. Im Falle n=2 


erhält man nach (4) nur eine (2?— 2— 1 =1) Bedingung für die 
Unabhängigkeit von zwei Ereignissen A, und 4A;: 


6) P(A,A,) = P(A,)P(A,). 


Das System der Gleichungen (2) besteht in diesem Falle außer (5) noch 
aus drei Gleichungen: 


P(4,4,) = P(A,)P(4,), 
P(4,4,) = P(A,)P(4,), 
P(A,A,) = P(A,)P(A,), 
welche in ersichtlicher Weise aus (5) folgen?. 


Man braucht dabei kaum zu bemerken, daß aus der daarweisen 
Unabhängigkeit der Ereignisse A), As,..., A„, d.h. aus der Relation 


P(4,A,) =P(4A,)P(4,) i=#J 


im Falle & > 2 noch keineswegs die Unabhängigkeit dieser Ereignisse 
folgt® [dafür ist das Bestehen aller Gleichungen (4) notwendig]. 


t Vgl. S. BERNSTEIN [1], S.47—-57. Der Leser kann das übrigens selbst 
mühelos nachprüfen (Induktionsschluß). 

* P(41A2) = P(A,),— P(41A2) = P(A,) — P(A,) P(A3) = P(A,) {1 — P(Ay)} 
= P(A,) P(A,) usw. 

3 Das zeigt auch das folgende einfache Beispiel (S. BERNSTEIN): Die Menge E 
besteht aus vier Elementen £,, &,, £,, &,, die entsprechenden elementaren Wahr- 
scheinlichkeiten ?,, sa, ?s, d, werden alle gleich 4 gesetzt und A = {&,,&}, 
B={8,,8}3, C={£,.&} ist. Man berechnet leicht, daß dann P(A) = P(B) 
=P(C) = 3, P(AB) = PıBC) = P(A) = 4= (H*, P(ABC) =} + ()° ist. 
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Wir haben bei der Einführung des Unabhängigkeitsbegriffes die 
bedingten Wahrscheinlichkeiten nicht gebraucht. Unser Ziel war dabei, 
das Wesen dieses Begriffes rein mathematisch möglichst klar darzustellen. 
Seine Anwendungen beruhen aber meistens auf Eigenschaften gewisser 
bedingter Wahrscheinlichkeiten. Nehmen wir an, daß alle Wahrschein- 
lichkeiten P(A\) positiv sind, so folgt aus den Gleichungen (3), daß 


(6) Pau... am-» (Ag?) = P(Ag) 
1 p} (m-ı 


ist!. Aus dem Bestehen der Formeln (6) folgen umgekehrt nach dem 
Multiplikationssatz [Formel (7) aus $4] die Formeln (2). Wir haben 
also den | 

Satz II. Im Falle positiver Wahrscheinlichkeiten P (4%) ist folgende 
Bedingung für die Unabhängigkeit der Versuche AP, A, ..., A not- 
wendig und hinreichend: Die bedingte Wahrscheinlichkeit eines Aus- 
ganges A® des Versuches A® unter der Hypothese, daß einige andere 
Versuche X, A), ..., A» bestimmte Ausgänge AW, A, A, ..., an 
hatten, ist der absoluten Wahrscheinlichkeit P(A®) gleich. 

Auf Grund der Formeln (4) beweist man ganz analog auch den 
folgenden Satz: 
Satz III. Wenn alle Wahrscheinlichkeiten P(A,) positiv sind, so 
ist das Bestehen der Gleichungen 


(7) Padua, (A) = PA) 


bei beliebigen paarweise verschiedenen ?,, 5, .. .,?;, ? für die gegen- 
seitige Unabhängigkeit der Ereignisse A,, A,,..., A„ notwendig und 
hinreichend. 

Im Falle » = 2 reduzieren sich die Bedingungen (7) auf zwei Glei- 
chungen | 
(8) | Pu,(A)=P(4)), 

P,(A)=P(4). 

Man ersieht sogleich, daß schon die Gleichung (8) allein eine notwendige 


und hinreichende Bedingung für die Unabhängigkeit von A, und A, 
darstellt, wenn nur P(A,) > 0 ist. 


$ 6. Bedingte Wahrscheinlichkeiten als zufällige Größen, 
Markortsche Ketten. 


Es sei X eine Zerlegung der Grundmenge E: 
E=A+4%+:-+4 


ı Zum Beweise erinnere man sich an die Definition der bedingten Wahr- 
scheinlichkeit [Formel (5) aus $ 4] und ersetze die Wahrscheinlichkeiten der Durch- 
schnitte durch Produkte der Wahrscheinlichkeiten nach der Formel (3). 


Ergebnisse der Mathematik. II/3. Kolmogoroff. 2 
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und x eine reelle Funktion des Elementarereignisses &, welche auf 
jeder Menge A, einer entsprechenden Konstante. a, gleich ist. Man 
sagt in diesem Falle, daß x eine zufälligeGröße ist, und nennt die Summe 


Eh) = 2 a,P(4,) 


die mathematische Erwartung der Größe x. Die Theorie der zufälligen 
Größen und ihrer Erwartungen wird in dem dritten und vierten Kapitel 
entwickelt, und zwar ohne Beschränkung auf zufällige Größen, welche 
nur endlich viele verschiedene Werte annehmen können. 

Die zufällige Größe, welche auf jeder Menge A den Wert P4,(B) 
hat, nennen wir die bedingte Wahrscheinlichkeit von B nach dem Ver- 
such A und bezeichnen sie mit Py(B). Zwei Versuche AV und A 
sind also dann und nur dann unabhängig, wenn 


P4n(Ay") = P(4Y) q=1,2,...,7 
ist. 
Sind irgendwelche Zerlegungen (Versuche) AP, A, ..., A ge- 
geben, so bezeichnen wir mit 


KOYDI ,,, in 


die Zerlegung der Menge E in die Produkte WAR... AM. Die Ver- 
suche A, y2,..., A ® sind dann und nur dann gegenseitig unabhängig, 


wenn 
Pyumge ... ya-n (4) = P(AN) 


bei jeder Wahl von k und g ist!. 
Definition. Eine Folge 


YY,AY,...,Am,... 
von Versuchen bildet eine MARKOFFsche Kette, wenn bei jedem » und q 
Pywge ... un-» (Ag") = Pun-»(A7”) 
ist. 
Die MArKoFFschen Ketten bilden also eine natürliche Verallgemeine- 
rung der Folgen von gegenseitig unabhängigen Versuchen. Bezeichnet 


man 
Ban am, n) = Pam (Ai), m<n 


so lautet die Grundformel der Theorie von MARKOFFschen Ketten 


(1) | Darm (k,n) = 2 dasam (R,m) Dim (Mı N). k<m<n 


1 Die Notwendigkeit dieser Bedingungen folgt aus dem Satz Il, $ 5, daß sie 
auch hinreichend sind, schließt man unmittelbar aus dem Multiplikationssatz 
[Formel (7) des $ 4). 


213] $ 1. Das Stetigkeitsaxiom. 13 
mW a „ mzZ_ m Z—m m m Z eananamamaa_m_nanÖ,,,-—— el 
Bezeichnet man die Matrix ||d,... (m, n)|| mit d (m, n), so läßt sich (1) 


in der folgenden Form darstellen: 
(2) Pik,n) = d(k,w) d(m,n). k<m<n* 


Zweites Kapitel. 


Unendliche 
Wahrscheinlichkeitsfelder. 


$ 1. Das Stetigkeitsaxiom. 
Wir bezeichnen wie üblich mit DAm den Durchschnitt der Mengen 
m (in einer endlichen oder unendlichen Anzahl) und mit S A, ihre 


einge Nur im Falle disjunkter Mengen Am schreibt man 
ZAm statt SAn . Es ist also 


SAmm=AtAlt, 
ZAm=AıtAt, 
DAm= Ads 


Bei allen weiteren Betrachtungen setzen wir voraus, daß außer I-V 
noch das folgende Axiom erfüllt ist: 
VI. Für eine abnehmende Foige 


(1) A,R>A, DD. DA,D 

von Ereignissen aus 5 mit 

(2) DA, = 0 

gilt die Gleichung " 

(3) | limP(A,)=0. n > © 


In der ganzen weiteren Darstellung nennen wir Wahrscheinlichkeits- 
feld nur ein Wahrscheinlichkeitsfeld im Sinne des ersten Kapitels, 
welches außerdem dem Axiom VI genügt. Wahrscheinlichkeitsfelder 
im Sinne des ersten Kapitels könnte man Wahrscheinlichkeitsfelder im 
erweiterten Sinne nennen. 

Wenn das Mengensystem % endlich ist, folgt VI aus den Axiomen I-V. 
In der Tat gibt es in diesem Falle nur endlich viele verschiedene Mengen 
in der Folge (1); es sei A, die kleinste unter ihnen, dann fallen alle 


* Über die weitere Entwicklung der Theorie der MArkorfrschen Ketten vgl. 
R. v. Mıses [1] $ 16 und B. Hostınsky: Methodes generales du calcul des proba- 
bilites. Mem. Sci. math. Bd. 52. Paris 1931. 


2* 
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Mengen A,,, mit A, zusammen, und es gilt folglich 
A: = Artp = DAn =0, 


limP (4,) = P(0) = 0. 


Alle Beispiele von endlichen Wahrscheinlichkeitsfeldern aus dem ersten 
Kapitel genügen folglich auch dem Axiom VI. Das Axiomensystem 
I—VI ist somit widerspruchsfrei und unvollständig. 

Für die unendlichen Wahrscheinlichkeitsfelder ist dagegen das 
Stetigkeitsaxiom VI von den Axiomen I—V unabhängig. Da das neue 
Axiom nur für die unendlichen Wahrscheinlichkeitsfelder wesentlich ist, 
währe es kaum möglich, seine empirische Bedeutung zu erklären, etwa 
so, wie es für die Axiome I—V im $2 des ersten Kapitels skizziert 
wurde. Bei einer Beschreibung irgendwelcher wirklich beobachtbarer 
zufälliger Prozesse kann man nur endliche Wahrscheinlichkeitsfelder 
erhalten. Unendliche Wahrscheinlichkeitsfelder erscheinen nur als 
idealisierte Schemata reeller zufälliger Prozesse. Wir beschränken uns 
dabei willkürlich auf solche Schemata, welche dem Stetigkeitsaxıom VI 
genügen. Diese Beschränkung erwies sich bis jetzt bei den verschieden- 
sten Untersuchungen als zweckmäßig. 

Der erweiterte Additionssatz. Wenn A,,4Ag,...,4A,,... und A zu 
7; gehören, so folgt aus 


(4) A=)DA, 
die Gleichung " 
(5) | P(A)=P(4,) 
Beweis. Es sei " 
. Rn = 2 Am 


m>n 
gesetzt. Dann gilt offenbar 
D(R,) = 0 ’ 
n 
und folglich nach dem Axiom VI 
(6) liimP(R,)=0. N > © 
Nach dem Additionssatz ist andererseits 
(7) P(A)=P(A,) +P(A4) + +P(4,)+ PR). 
Aus (6) und (7) folgt unmittelbar (5). 
Wir haben also .bewiesen, daß die Wahrscheinlichkeit P(A) eine au 5 
vollständig additive Mengenfunktion ist. Umgekehrt gelten für jede auf 


einem Mengenkörper % definierte vollständig additive Mengenfunktion 
pP (A) die Axiome V und VI!. Man kann folglich den Begriff des Wahr- 


1 Vgl.z.B. O. NıkopyMm: Sur une generalisation des Integrales de M. J. Rapon. 
Fundam. Math. Bd. 15 (1930) S. 136. 
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scheinlichkeitsfeldes folgendermaßen definieren: Es seien E eine beliebige 
Menge, % ein Körper der Untermengen von E, welcher E enthält, und P(A) 
eine nichtnegative auf % definierte vollständig additive Mengenfunktion; 
der Mengenkörper % zusammen mit der Mengenfunktion P(A) bildet 
dann ein Wahrscheinlichkeitsfeld. 

Ein Überdeckungssatz. Wenn A,A,,Ag,..., Ay, ... zu % gehören 
und 


(8) ACCOSA, 

ist, so gilt “ | 

(9) P(A)= IP(4,). 
Beweis. 


A=AG(A,) = AA, + Ald2— AyA) + Alds— Asda— AA) +, 
P(A)=P(AA) + P{AA— AAYrtSPlA)+PA)+-. 


$ 2. BorEische Wahrscheinlichkeitsfelder. 


Ein Mengenkörper % ist ein BorELscher Körper, wenn alle abzähl- 
baren Summen IA, der Mengen A, aus % zu % gehören. Man nennt 


n 
BoreLsche Körper auch vollständig additive Mengensysteme. Aus der 
Formel 


1) SAn=AtlA—AA)t (A AA Adı)t 


schließt man, daß ein BoreLscher Körper auch alle Vereinigungsmengen 
©&A,„ abzählbar vieler zu ihm gehörender Mengen A, enthält. Aus der 
- | 


Formel 
(2) DA)=E-C©A 


folgt dasselbe für Durchschnittsmengen. 

Ein Wahrscheinlichkeitsfeld ist ein BorELsches Wahrscheinlichkeits- 
feld, wenn der entsprechende Mengenkörber % ein BoreELscher ist. Nur in 
Boreschen Wahrscheinlichkeitsfeldern erhält die Wahrscheinlichkeits- 
rechnung eine vollständige Handlungsfreiheit, die mit keiner Gefahr 
verbunden ist, zu Ereignissen zu gelangen, welche keine Wahrscheinlich- 
keit besitzen. 

Wir woller jetzt zeigen, daß man sich auf die Betrachtung der BOREL- 
schen Wahrscheinlichkeitsfelder beschränken kann. Dies ergibt sich aus 
dem Erweiterungssatze, zu dem wir gleich übergehen. 

Es sei ein Wahrscheinlichkeitsfeld (%, P) gegeben. Bekanntlich! 
existiert ein kleinster BorELscher Körper BY über %. Sodann gilt der 

Erweiterungssatz. Man kann immer die auf %5 definierte nicht- 
negative, vollständig additive Mengenfunktion P(A) auf alle Mengen von 


t Vgl. HAUSDORFF: Mengenlehre 1927 S. 79. 
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BY mit der Erhaltung der beiden Eigenschaften (nichtnegativ und voll- 
ständig additiv zu sein) erweitern, und zwar auf eine einzige Weise. 

Der erweiterte Körper B% bildet also mit der erweiterten Mengen- 
funktion P(A) auch ein Wahrscheinlichkeitsfeld (B$, P); dieses Wahr- 
scheinlichkeitsfeld (B%, P) nennen wir die BoRELsche Erweiterung des 
Feldes (5, P). 

Der Beweis dieses Erweiterungssatzes, welcher der Theorie der 
additiven Mengenfunktionen angehört. und in verschiedenen anderen 
Fassungen im wesentlichen bekannt sein dürfte, verläuft folgender- 
maßen: 

Es sei A eine beliebige Untermenge von E, wir definieren P*(A) 
als untere Grenze der Summen | 


2 P(A,) 
für alle Überdeckungen 
Ac © An 


der Menge A mit endlich oder abzählbar vielen Mengen A, aus iy. Man 
beweist leicht, daß P*(A) ein äußeres Maß im Sinne von CARATHEODORY 
ist!. Für die Mengen A aus % fällt P*(A) nach dem Überdeckungssatz 
($ 4) mit P(4) zusammen. Man beweist weiter, daß alle Mengen von % 
im CARATHEOPORYschen Sinne meßbar sind. Da alle meßbaren Mengen 
einen BorELschen Körper bilden, so sind also alle Mengen von BF 
meßbar. Die Mengenfunktion P* (A) ist also auf B% vollständig additiv, 
und wir können auf BF 
P(A4)=P*(4) 

setzen. Die Existenz der Erweiterung ist somit bewiesen. Die Ein- 
deutigkeit der Erweiterung folgt unmittelbar aus der Minimaleigenschaft 
des Körpers B%. 

Bemerkung. Wenn man die Mengen (Ereignisse) A aus % als 
reelle und (vielleicht nur annäherungsweise) beobachtbare Ereignisse 
deuten kann, so folgt daraus natürlich noch nicht, daß die Mengen 
des erweiterten Körpers B% eine solche Deutung als reelle beobachtbare 
Ereignisse vernünftigerweise gestatten. Es karin also vorkommen, daß 
das Wahrscheinlichkeitsfeld (%, P) als ein (vielleicht idealisiertes) Bild 
reeller zufälliger Erscheinungen betrachtet werden kann, während das 
erweiterte Wahrscheinlichkeitsfeld (BY, P) eine rein mathematische 
Konstruktion bleibt. | 

Mengen aus B% betrachten wir also im allgemeinen nur als ‚‚ideelle 
Ereignisse‘, welchen in der Erfahrungswelt nichts entspricht. Wenn 
aber eine Deduktion, die die Wahrscheinlichkeiten solcher ideellen Er- 
eignisse gebraucht, zur Bestimmung der Wahrscheinlichkeit eines reellen 
Ereignisses aus % führt, wird diese Bestimmung offensichtlich auto- 
matisch auch vom empirischen Standpunkte aus einwandfrei sein. 


1 CARATHEODORY: Vorlesungen über reelle Funktionen 1918 $. 237 — 258. 
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$ 3. Beispiele unendlicher Wahrscheinlichkeitsfelder. 


I. Schon im ersten ‚ Kapitel, $1 haben wir verschiedene endliche 
Wahrscheinlichkeitsfelder konstruiert. Es sei jetzt die Menge 


E= {&,, &» --- Ense 


abzählbar und % mit der Gesamtheit der Untermengen der Menge E 
identisch. 

Alle möglichen Wahrscheinlichkeitsfelder .mit einer solchen Menge % 
erhält man folgendermaßen: Man wählt eine Folge von nichtnegativen 
Zahlen £,„ mit | 

ph +b+ +ht- =1 


und setzt für jede Menge A 
P(A)= dr: 
n 


wobei die Summation I’ sich auf alle Indizes % erstreckt, für welche 
&, zu A gehört. Diese Wahrscheinlichkeitsfelder sind offensichtlich 
BoreLsche. 

II. Wir nehmen jetzt an, daß E die reelle Zahlengerade ist. Zuerst 
sei dabei % aus allen endlichen Summen von halb offenen Intervallen 
[a;b) ={asE<b} gebildet (dabei betrachten wir neben den eigent- 
lichen Intervallen mit endlichen a und 5b auch die uneigentlichen 
[— 00; a), [a; +oo) und [—oo; +o0)). Man überzeugt sich leicht, daß 
% ein Körper ist. Nach dem Erweiterungssatz kann man aber jedes 
Wahrscheinlichkeitsfeld auf % in ein solches auf B% erweitern. Das 
Mengensystem B% ist in unserem Falle nichts anderes als das System 
aller BorErschen Punktmengen der Zahlengeraden E. Wir können 
also direkt zum folgenden Falle übergehen. 

Ill. Es wird jetzt angenommen, daß E die reelle Zahlengerade ist 
und % aus allen BorELschen Punktmengen dieser Gerade besteht.’ Um 
ein Wahirscheinlichkeitsfeld mit diesem Körper % zu konstruieren, ge- 
nügt es, eine beliebige 'nichtnegative vollständig additive Mengen- 
funktion P(A) auf % zu definieren, welche die Bedingung P(Z) = 1 
befriedigt. Eine solche Funktion ist bekanntlich! durch ihre Werte 
(1)  Pl-w»;2)=F() 
für die speziellen Intervalle [-—-oo;x) eindeutig bestimmiı. Die Funk- 
tion F(x) nennt man Verteilungsfunktion von &. Es ist weiter bewiesen 


(drittes Kap., $2), daß F(x) nicht abnehmend und nach links stetig 
ist und die Limeswerte 


(2) im F@&)=F(-o)=0, IlmFa)=F(+o)=1 


z—o>%9 


besitzt. Ist umgekehrt eine diesen Bedingungen genügende Funktion 


1 Vgl. z.B. LEBESGUE: Lecons sur l’integration 1928 S. 152— 156. 
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F(x) gegeben, so bestimmt sie immer eine nichtnegative vollständig 
additive Mengenfunktion P(A) mit P(E) =1 *. 

IV. Es sei jetzt der n-dimensionale euklidische Koordinatenraum 
R"*, d.h. die Menge aller geordneten rn-Tupeln € = {x,,%,.. -, Xu} 
reeller Zahlen, als die Grundmenge E gewählt. % bestehe dabei aus 
allen BorEschen Punktmengen! von R*. (Auf die Betrachtung ver- 
schiedener engerer Mengensysteme, z.B. des Systems aller r-dimen- 
sionalen Intervalle, können wir aus Gründen, die den in II angegebenen 
analog sind, verzichten.) | 

Als Wahrscheinlichkeitsfunktion P(A4) kann man hier wie immer 
eine beliebige nichtnegative und vollständig additive Mengenfunktion 
wählen, welche auf % definiert ist und der Bedingung P(E) = 1 genügt. 
Eine solche Mengenfunktion wird eindeutig bestimmt, wenn man ihre 
Werte 
(3) P(La,a,...an) = Fla,, Ag, ..., An) 
für die speziellen Mengen L,a,...., angibt, wobei L,a,...., die 
Menge aller &E mit 2,<a,,i=1,2,...,n, bezeichnet. Als Funktion 
F(a,,a,,...,a,) kann man dabei eine beliebige in jeder Veränderlichen 
nicht abnehmende und nach links stetige Funktion wählen, welche den 
folgenden Bedingungen genügt: | 

lim Fl(a,,a,,...,4) = Fla,:..,%-1, —®,441:-.,%)=0, 


a>-o 


(4) w—=1,2,...,n 
| lim F(a,,4,,.:.,%) =F(+®,+9,...,+00) =1. 


a4 > +%9,4,>+09,..,4n>+% 
Man nennt F(a,,a,,...,a,) die Verteilungsfunktion der Größen 
K%ı,Xgs ++ + In | 

Die Betrachtung der Wahrscheinlichkeitsfelder des oben definierten 
Typus genügt vollständig für alle klassischen Probleme der Wahrschein- 
lichkeitsrechnung?. 

Insbesondere definiert man eine Wahiıscheinlichkeitsfunktion in R”, 
wenn man eine beliebige im R* definierte nichtnegative Punktfunktion 
x &%g,-- -,%,) mit 

+00 +00 +00 
f S- ICH ..:,%n) AR d%,... du —1 


nimmt und 
(3) PY= SS... [Manan am) dmdan dam 


* Vgl. die vorige Fußnote. 

i Für die Definition der Boreıschen Mengen des R" vgl. HAUSDORFF: Mengen- 
lehre 1927 S. 177-181. 

2 Vgl. z.B. R. v.Mıses: [1], S.13—19. Hier fordert man die Existenz der 
Wahrscheinlichkeiten P(A) für ‚alle praktisch vorkommenden‘ Mengen des 
»-dimensionalen Raumes. 
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setzt. Dann ist f(x, , %,, - - -, %,) die Wahrscheinlichkeitsdichte im Punkte 
(X, 2, + .,%,) (vgl. drittes Kap., $2). 

Ein anderer Typus der Wahrscheinlichkeitsfunktionen in R" erhält 
man folgendermaßen: Es sei {&;} eine Folge von Punkten aus R” und 
{d,} eine Folge von nichtnegativen reellen Zahlen mit 2, = 1; dann 
setzt man wie im Beispiele I 

P(A) = zb 
wobei die Summation $’ sich auf alle Indizes ö erstreckt, für welche £ 
zu A gehört. Zwei hier erwähnte Typen der Wahrscheinlichkeits- 
funktionen in R* erschöpfen nicht alle Möglichkeiten, obwohl man sich 
mit ihnen in den Anwendungen der Wahrscheinlichkeitsrechnung ge- 
wöhnlich begnügt. 

Man kann sich jedoch außer diesem klassischen Gebiet auch für 
Anwendungen interessante Probleme vorstellen, in welchen Elementar- 
ereignisse mit Hilfe unendlich vieler Koordinaten definiert sind. Ent- 
sprechende Wahrscheinlichkeitsfelder wollen wir erst nach Einführung 
einiger hierzu notwendigen Hilfsbegriffe näher untersuchen (vgl. drittes 


Kap., $ 3).. 


Drittes Kapitel. 
Zufällige Größen. 


$ 1. Wahrscheinlichkeitsfunktionen. 


Es sei eine Abbildung der Menge E in eine Menge E’ von irgend- 
welchen Elementen, d.h. eine auf E definierte eindeutige Funktion 
u(£), deren Werte zur Menge E’ gehören, gegeben. Jeder Untermenge 
A’ von E’ ordnen wir dann als ihr Urbild in E die Menge v"1(A') 
aller Elemente von E zu, welche auf ein Element von A’ abgebildet 
sind. Es sei weiter %'% das System aller Untermengen A’ von E’, deren 
Urbilder zum Mengenkörper % gehören. 5 ist dann auch ein Körper; 
ist dabei % ein BoreEıscher Körper, so gilt dasselbe auch von %®. 
Wir setzen jetzt | 


(1) P@)(4') = Plu-1(A')}. 


Diese auf %% definierte Mengenfunktion P® genügt in bezug auf den 
Mengenkörper 5% allen unseren Axiomen I—V]J, ist folglich eine Wahr- 
scheinlichkeitsfunktion auf %'%. Bevor wir zum Beweise aller soeben 
angegebenen Tatsachen übergehen, wollen wir schon jetzt die folgende 
Definition aussprechen: 

Definition. Es sei eine eindeutige Funktion. «(£) des zufälligen 
Ereignisses & gegeben. Dann heißt die durch (1) definierte Mengen- 
funktion P®(A’) die Wahrscheinlichkeitsfunktion von u. 
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Bemerkung 1. Man nennt bei der Untersuchung des Wahrschein- 
lichkeitsfeldes (%, P) die Funktion P(A) schlechthin die Wahrschein- 
lichkeitsfunktion und P(A’) die Wahrscheinlichkeitsfunktion von «. 
Im Falle v(&) = £ fällt P®(A’) mit P(A) zusammen. 

Bemerkung 2. Das Ereignis «-1(A’) besteht darin, daß «(£) 
zur Menge A’ gehört. Folglich ist P!“(A’) die Wahrscheinlichkeit dafür, 
daß u(&$)cC 4’ gilt. 

Es bleibt uns die obenerwähnten Eigenschaften von % und P 
zu beweisen, Sie folgen aber aus einer einzigen fundamentalen Tatsache, 
und zwar aus der folgenden: 

Hilfssatz. Vereinigungsmengen, Durchschnitte und Differenzen be- 
liebiger Urbildmengen «-1(A’) sind Urbilder der entsprechenden Ver- 
einigungsmengen, Durchschnitte und Differenzen originaler Mengen A’. 

Der Beweis dieses Hilfssatzes darf dem Leser überlassen werden. 

Es seien jetzt A’ und B’ zwei Mengen aus %*), ihre Urbilder A und B 
gehören dann zu %; da % ein Körper ist, gehören auch die Mengen 
AB,A + Bund A — Bzuf, diese Mengen sind aber die Urbilder der 
Mengen A’B’,A’ + B’ und A’ — B’, folglich gehören letztere Mengen 
zu 3%. Wir haben also bewiesen, daß %®) ein Körper ist. Ebenso beweist 
man, daß, wenn F ein BorELscher Körper ist, dasselbe auch von % gilt. 

Es ist ferner klar, daß 

P@(E) = P{u(E)}= PIE) =1 
ist. Daß P immer nichtnegativ ist, ist selbstverständlich. Es bleibt 
folglich zu beweisen, daß P( vollständig additiv ist (vgl. das Ende des 
$ 1, zweites Kap.). Es seien also die Mengen A,, folglich auch ihre Ur- 
bilder u”1(4A/) disjunkt; daraus folgt aber, daß 
PO (ZA) = P{u (ZAN} = P{Zu(An)} 
= ZP{u!(A)} = I PO (A) 

ist, womit die vollständige Additivität von P’ bewiesen ist. 

Zum Schluß wollen wir noch folgendes bemerken. Es sei u, (£) 
eine Funktion, welche E in E’ abbildet, und #, (£’) eine andere Funktion, 
welche E’ in E’’ abbildet. Dann bildet die zusammengesetzte Funktion 
Usu,(£) die Menge E in E’ ab. Wir betrachten jetzt die Wahrscheinlich- 
keitsfunktionen Pw)(A’) und P@(A’”) der Funktionen #,(£) und 
u(E) = ugu,(£). Diese zwei Wahrscheinlichkeitsfunktionen sind, wie 
man leicht berechnet, durch die folgende Relation verbunden: 

(2)  P@(4”) = Pw[uz1(4”)}. 


$ 2. Definition der zufälligen Größen, V erteilungsfunktionen. 


Definition. Eine auf der Grundmenge E definierte eindeutige 
reelle Funktion x(£) nennt man eine zufällige Größe, wenn bei jeder 


221] $2. Definition der zufälligen Größen, Verteilungsfunktionen. 24 





Wahl einer reellen Zahl a die Menge {x <a} aller &, für welche die 
Ungleichung x <a gilt, zum Mengensystem % gehört. 

Die Funktion x(&) bildet die Grundmenge E in die Menge R\ aller 
reellen Zahlen ab. Diese Funktion bestimmt nach $1 einen Körper 
3 von Untermengen der Menge R!. Unsere Definition einer zufälligen 
Größe kann jetzt so formuliert werden: Eine reelle Funktion x(£) ist 
dann und nur dann eine zufällige Größe, wenn %® jedes Intervall von 
der Form (—oo,a) enthält. 

Da %® ein Körper ist, so enthält er mit den Intervallen (— oo; a) 
auch alle möglichen endlichen Summen von halboffenen Intervallen 
[a;b). Wenn unser Wahrscheinlichkeitsfeld ein BorELsches ist, so sind 
% und %@ Boreısche Körper, folglich enthält in diesem Falle 5” alle 
BoreLschen Mengen von R!. 

Die Wahrscheinlichkeitsfunktion einer zufälligen Größe bezeichnen 
wir weiter mit P@&(4A’). Sie ist für alle Mengen des Körpers F® defi- 
niert. Im wichtigsten Falle des BorEischen Wahrscheinlichkeitsfeldes: 
ist also P@® insbesondere für alle BoreELschen Mengen des R! definiert. 

Definition. Die Funktion 


F®%(a) =P®(—o,a) =Plx<a}, 
wobei —oo und +oo als Werte von a zugelassen sind, heißt die Ver- 


teilungsfunktion der zufälligen Größe x. 
Es folgt unmittelbar aus unserer Definition, daß 


1) Fa(—-&)=0, F@(+o)=1 


ist. Die Wahrscheinlichkeit der Erfüllung beider Ungleichungen a < x< b 
ist offenbar durch die Formel 


(2) P{xc [a; 5b} = F@®(b) — F@ (a) 
gegeben. Es folgt daraus, daß für a <b 
F® (a) = F®(b) 


ist, wenn nur a<b ist, d.h. daß F®(a) eine nichtabnehmende Funk- 
tion ist. 
Es sei ferner a, <a, <---<a,<++-<b; dann ist 


Dir <[a,;b}=0, 
folglich konvergiert wegen des Stetigkeitsaxioms 
F®(b) — F®%(a,) = P{xc [a,, b)} 


mit n—-+- oo gegen Null. Man sieht also, daß F® (a) linkseitig stetig ist. 
Es lassen sich analog die Formeln 


0) limF®%(a) = F9(—x)=0, a>—oo, 
(4) imF®(a)=F®(+%)=1, a> oo, 


beweisen. 
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Ist das Wahrscheinlichkeitsfeld (%, P) ein BorELsches, so sind die 
Werte der Wahrscheinlichkeitsfunktion P®(A) für alle BorELschen 
Mengen A des R! durch die Kenntnis der Verteilungsfunktion F® (a) 
eindeutig bestimmt (vgl. zweites Kap., $ 3, III). Da man sich meistens 
nur für solche Werte von P®(A) interessiert, spielen die Verteilungs- 
funktionen in der ganzen weiteren Darstellung eine wesentliche Rolle. 

Wenn die Verteilungsfunktion F®(a) differentiierbar ist, so nennt 
man ihre Ableitung | 


f%(a) = Z F&(a) 
nach a die Wahrscheinlichkeitsdichte von x im Punkte a. Ist dabei 
für jedes a F® (a) = 2 f‘® (a) dg, so läßt sich die Wahrscheinlichkeits- 


funktion P®(A) für eine BorELsche Menge A folgendermaßen durch 
/(a) ausdrücken: 


(5) P@)(A) = / f® (a)da. 
A 


In diesem Falle sagt man, daß die Verteilung von x stetig ist. Im all- 
gemeinen Falle schreibt man analog 


(6) P@)(A) = / dF& (a). 
A 


Alle angeführten Begriffsbildungen lassen sich auch auf den Fall 
der bedingten Wahrscheinlichkeiten verallgemeinern. Die Mengen- 
funktion 

PE(A) = Pz(xc A) 


ist die bedingte Wahrscheinlichkeitsfunktion von x in der Hypothese B 
die nichtabnehmende Funktion 


FE (a) = Ps(x <a) 


ist die entsprechende Verteilungsfunktion, und endlich [im Falle der 
Differentiierbarkeit von F%(a)] ist 


d 
# (a) = F@(a) 


die bedingte Wahrscheinlichkeitsdichte von x im Punkte a bei der 
Hypothese B. 


$ 3. Mehrdimensionale Verteilungsfunktionen. 


Es seien jetzt n zufällige Größen x,, %,, . . ., x, gegeben. Der Punkt 
x = (%,%g9,...,%,) des n-dimensionalen Raumes R ist eine Funktion 
des elementaren Ereignisses &. Man erhält folglich nach den allgemeinen 
Regeln des $ 4 einen Mengenkörper %% #2» yon Untermengen des 
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Raumes R" und eine auf % definierte Wahrscheinlichkeitsfunktion 
Pr, 2%,-..‚2»)(4’). Diese Wahrscheinlichkeitsfunktion P(% ?» ---» 2» nennt 
man die n-dimensionale Wahrscheinlichkeitsfunktion der zufälligen 
Größen %,&%g: - -, Xn- 

Der Körper %’ enthält, wie es direkt aus der Definition einer zu- 
fälligen Größe folgt, bei jeder Wahl von ? und a, ? =1,2,...,n) die 
Menge aller Punkte von R”, für welche x; < a; ist. Folglich enthält 5 
auch den Durchschnitt der genannten Mengen, d. h. die Menge L,, a... ar 
aller Punkte von R*, für welche alle Ungleichungen 2,<a;,, i=1,2,...,n, 
gelten!. Bezeichnet man als ein »-dimensionales halboffenes Intervall 


[@,, QAg» --.,An5 Di Das - - -, ©) 
die Menge aller Punkte von R*, für welche alle Ungleichungen a,<x;,< 5, 


erfüllt sind, so sieht man sofort ein, daß jedes solches Intervall auch zum 
Körper ?% gehört, denn es ist 
[a,, Ag, -.., an; Di, da, » . ., Du) 
= Iydı...dn — Lade... 0 — Idrasds en — °" — did... ön-10n 

Die BorEısche Erweiterung des Systems aller »n-dimensionalen halb- 
offenen Intervalle besteht aber aus allen BorELschen Mengen des R". 
Es folgt daraus, daß der Körper % im Falle eines BorELschen Wahr- 
scheinlichkeitsfeldes alle BoRELschen Mengen des Raumes R" enthält. 

Satz. Im Falle eines Boreıschen Wahrscheinlichkeitsfeldes ist 
jede BorELsche Funktion x = [(%,,%g, -- .,%,) endlich vieler zufälliger 
Größen %ı, %g, - - -, X, wieder eine zufällige Größe. 

Zum Beweis genügt es, zu bemerken, daß die Menge aller Punkte 
(X, %2, -- -,%,) des R*, für welche x = f(%,, %, ...,%,) <a gilt, eine 
BoreLsche ist. Insbesondere sind also endliche Summen und Produkte 
zufälliger Größen wieder zufällige Größen. 

Definition. Die Funktion 


Fa, U; ...,%n) (a,, Ag, .o.;, 4,) = Par, 23; _. zn) (L.,a, rn) 


nennen wir die n-dimensionale Verteilungsfunktion der zufälligen Größen 
X%,X9, -» > Ay 

Man beweist wie im eindimensionalen Falle, daB Fr: 2, ..., zu) 
(4), @g,...,a,) in jeder Variablen nicht abnehmend und nach links 
stetig ist. Analog zu den Gleichungen (3) bis (4) des $2 hat man hier 


(7) limFla, a,...,0) =Fla, :--.,%., —o, 4 --,M)=0, 
(8) limFla,a,,.. e a.) =F(+®, +0,...,+00) =1. 


a>+9,. > +9,..,0>+% 
Die Verteilungsfunktion F**# .--=») gibt uns direkt nur die Werte 
von P'?»?» ...»=») für die speziellen Mengen L, «,....,. Wenn aber unser 
Wahrscheinlichkeitsfeld ein BorRELsches ist, so ist P% 23: ---» 2m) Zurch die 


1 a, können dabei auch unendliche Werte +oo annehmen. 
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Kenntnis der Verieilungsfunktion F*» ?* *--» ?=) für alle BoRELschen Mengen 
von R* eindeutig bestimmt‘. | 
Wenn die Ableitung 
ör 


f(a,, ag, -- -, a) = da, da, ... da, Fan a, ...20) (q,a,,...,4,) 


existiert, so nennt man diese Ableitung / die n-dimensionale Wahr- 
scheinlichkeitsdichte der zufälligen Größen %,,%,,...,%, im Punkte 
A),Ag,...,4,. Ist dabei für jeden Punkt (a,,a,,...,a,) 


4dı Ga a 


Fawza,..., 20) (4,a,...q,) -/[ J-- .[fa,, Ag, ..., Ay) da, da, ...da,, 


so nennt man die Verteilung von (a,, a,,....., a,) stelig. Für jede BoREL- 
sche Menge A R" gilt dann die Gleichung 


(9) Pavan....zu) (A) =/f. Ha. Ag» ...,a,)da,da,...da,. 
A 


Zum Schluß dieses Paragraphen machen wir noch eine Bemerkung 
über Relationen zwischen verschiedenen Wahrscheinlichkeits- und Ver- 
teilungsfunktionen. Es sei zuerst eine Permutation 


1, 2, ..0.;,: n 
s-(, | .) 
I, dar son m) 


gegeben, und r, bezeichne die Transformation 


= x | k=1,2,...,nNn 
des Raumes R” in sich selbst. Dann gilt offenbar 
(10) pl, 2) (A) — Pla, ®, zn {r5t(A)}. 


Es sei jetzt x = ?,(x) „die Projektion‘ des Raumes R" in den 
Raum R#(k <n), bei welcher der Punkt (x,,%,,. . .,%,) in den Punkt 
(X, Xg, . . ., %) abgebildet wird. Dann gilt infolge der Formel (2) des $ 1 


(14)  Pewan 2) (4) = Paoas 20 (pH, 1(A)} 

Für die entsprechenden Verteilungsfunktionen folgen aus (10) und 
(14) die Gleichungen 
(12) pe: ai PERLE IT Ti.) (a;,, ;, Bar a,) — Fa, I, +.., Zn) (a,, Ay, . 4.) , 


(13) Fia,z:, 2) (q,, Ags .-.» 4,) — Feuz,..san)(g,, ...,Q@k, +00, ..., +). 


$ 4. Wahrscheinlichkeiten in unendlichdimensionalen 
Räumen. 


Wir haben in $ 3 des zweiten Kapitels gesehen, wie man verschiedene 
in der Wahrscheinlichkeitsrechnung übliche Wahrscheinlichkeitsfelder 


1 Vgl. zweites Kapitel, $ 3, IV. 
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konstruiert. Man kann sich jedoch auch für Anwendungen interessante 

Probleme vorstellen, in welchen Elementarereignisse mit Hilfe unendlich- 

vieler Koordinaten definiert sind. Es sei also eine Menge M — be- 

liebiger Mächtigkeit m — der Indizes u gewählt. Die Gesamtheit 

aller Systeme | 
E= {&u} 


reeller Zahlen x,, wobei u die ganze Menge M durchläuft, wird als der 
Raum RM bezeichnet (um ein Element & des Raumes R# zu bestimmen, 
soll man also jedem Elemente # der Menge M eine bestimmte reelle 
Zahl x, zuordnen oder, was dasselbe ist, eine auf M definierte eindeutige 
reelle F unktion x, des Elementes u angeben)!. 

Wenn die Menge M aus n ersten natürlichen Zahlen 1, 2,...,n 
besteht, so ist RM der gewöhnliche »-dimensionale Raum R”. Wählt 
man als Menge M die Menge aller reellen Zahlen R!, so besteht der 
entsprechende Raum RM“ = RE aus allen reellen Funktionen 


eu) % 
des reellen Argumentes uw. 

Die Menge RM (mit einer "beliebigen Menge M) nehmen wir jetzt 
zur Grundmenge E. Es sei € = {x M ein Element von E; wir bezeichnen 
dann mit Dumm. u(&) den Punkt (Kur Ku: u) des n-dimen- 
sionalen Raumes Rr. Eine Untermenge A von E nennen wir eine Zylin- 
dermenge, wenn sie in der Form 


A= Pam... m(A') 


darstellbar ist, wobei A’ eine Untermenge von R* ist. Die Klasse aller 
Zylindermengen fällt also mit der Klasse von allen solchen Mengen, 
welche durch eine Relation von der Form 


(1) | &m Kurs > > Km) = 0 

definiert werden können, zusammen. Um eine beliebige Zylindermenge 
Dam... (A) durch eine solche Relation zu bestimmen, genügt es, 
als / eine Funktion zu nehmen, welche auf A’ gleich Null und außerhalb 
A’ gleich Eins ist. 

Eine Zylindermenge ist eine BorELsche Zylindermenge, wenn die 
entsprechende Menge A’ eine BorELsche ist. Alle BorELschen Zylinder- 
mengen des Raumes R* bilden einen K örper, welcher weiter mit 5“ be- 
zeichnet wird®. 


ı Vgl. HAUSDORFF: Mengenlehre 1927 S. 23. 

2 Aus den oben angeführten Betrachtungen folgt, daß BorELsche Zylinder- 
mengen diejenigen Mengen sind, welche durch Boreische Relationen (1) defi- 
niert werden können. Es seien jetzt A und B zwei BorEısche Zylindermengen, 
welche durch die Relationen 


MR» Kun + Fun) = 0 Era» Kir Ai) = 0 
definiert sind. Dann kann man die Mengen A+B, AB und A—B bzw. durch 
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Die BoreEsche Erweiterung des Mengenkörpers %M bezeichnen wir 
wie immer mit BSM. Die Mengen des Mengensystems B%” nennen 
wir die BoRELschen Mengen des Raumes RM. 

Es wird weiter eine Methode angegeben, Wahrscheinlichkeitsfunk- 
tionen auf %M und folglich nach dem Erweiterungssatz auch auf BF 
zu konstruieren und zu behandeln. Die so erhaltenen Wahrscheinlich- 
keitsfelder reichen im Falle einer abzählbaren Menge M für alle Zwecke 
hin. Man beherrscht also alle Fragen über das Verhalten einer abzähl- 
baren Folge von zufälligen Größen. Wenn aber M unabzählbar ist, so 
bleiben manche einfache und interessante Untermengen von RY noch 
außerhalb des Mengensystems BS”. Z.B. die Menge aller Elemente £, 
für welche x,, bei jeder Wahl des Indizes u kleiner als eine feste Konstante 
bleibt, gehört im Falle einer unabzählbaren Menge M nicht zum Mengen- 
system BSM. 

Es ist folglich immer erstrebenswert, jedes Problem, wenn möglich, 
in einer solchen Form zu bringen, bei welcher der Raum aller elementaren 
Ereignisse & nur abzählbar viele Koordinaten hat. 

Es sei eine Wahrscheinlichkeitsfunktion P(A) auf %# definiert. 
Jede Koordinate x, des elementaren Ereignisses & kann dann als eine 
zufällige Größe betrachtet werden. Folglich besitzt jede endliche Gruppe 
(Kur Kar > > %,) von diesen Koordinaten eine »-dimensionale Wahr- 
scheinlichkeitsfunktion P,.„,...„„(A) und eine entsprechende Vertei- 
lungsfunktion Fa... un(41> 42, --., @„). Man hat offensichtlich für jede 


BoreLsche Zylindermenge 
A=Bph,..m (A) 


Kılla«». 


die Gleichung 
P(A) = Pauns...un (A) ’ 


wobei A’ eine BorELsche Menge von R* ist. Die Wahrscheinlichkeits- 
funktion P ist also auf dem Körper %” aller Zylindermengen durch die 
Kenntnis der Werte aller endlichdimensionalen Wahrscheinlichkeits- 
funktionen Pa... für alle Boreischen Mengen der entsprechen- 
den Räume R” eindeutig bestimmt. Für BorELsche Mengen sind 
aber die Werte der Wahrscheinlichkeitsfunktionen P,.,...„, eindeutig 
durch die entsprechenden Verteilungsfunktionen F, 4... bestimmt. 
Wir haben also den folgenden Satz bewiesen: | 


die folgenden Relationen definieren: 


f-g=®b, 
P+e=0, 
P+oß)=0, 


wobei @(z) =0 für + #0 und ®(0) = 1 gesetzt ist. Wenn f und g BorELsche 
Funktionen sind, so gilt dasselbe für die Funktionen /-.g, ?+g? und ?-+ weg), 
folglich sind A+B, AB und A—B Boreısche Zylindermengen. Somit ist die 
Körpereigenschaft des Mengensystems %” bewiesen. 
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Die Gesamtheit aller endlichdimensionalen Verteilungsfunktionen 
Farmn...nm Gefiniert eindeutig die Wahrscheinlichkeitsfunktion P(A) für 
alle Mengen von F#. Ist P(A) auf BSM definiert, so ist sie (nach dem 
Erweiterungssatz) auch auf BYM eindeutig durch die Kenntnisse der 
Verteilungsfunktionen F ta... m bestimmt. 

Es liegt jetzt nahe, sich die Frage zu stellen, unter welchen Bedin- 
gungen ein a priori gegebenes System von Verteilungsfunktionen 
Futn...um ein Wahrscheinlichkeitsfeld auf %7 (und folglich auch auf 
B aM) bestimmt. | 

. Zuerst bemerken wir, daß jede Verteilungsfunktion F,..... den 
im zweiten Kapitel, $ 3, III angegebenen Bedingungen genügen N muß, 
was allerdings im Begriffe der Verteilungsfunktion enthalten ist. 
Außerdem gelten wegen den Formeln (13) und (14) des $2 noch die 
‚folgenden Relationen: 


(2) Frag ni, (Mo A, oo; 4;,) aan Fans. m (Ar As, ...7 A,) N 
(3) Farm ...ur (Ar Ag a) = Finmae. un lArr Apr.» +09,..., +00), 


wobei k<n und (; Ze ;) eine beliebige Substitution ist. Diese 


Äg 000, 
notwendigen Bedingungen sind aber auch hinreichend, wie es sich aus 
dem folgenden Satze ergibt: 

Hauptsatz. Jedes System von Verteilungsjunktionen F aten ee. un 
welche den Bedingungen (2) und (3) genügen, bestimmt eine Wahrschein- 
lichkeitsfunktion P(A) auf 34, welche allen Axiomen I—VI genügt. 
Diese Wahrscheinlichkeitsfunktion P(A) kann (nach dem Erweiterungs- 
satz) auch auf BE erweitert werden. 

Beweis des Hauptsatzes. Es seien also die Verteilungsfunktionen 
Fauna... um gegeben, welche den allgemeinen Bedingungen vom zweiten 
Kapitel, $3, III und den Bedingungen (2) und (3) genügen. Jede 
Verteilungsfunktion Fu... definiert eindeutig die entsprechende 
Wahrscheinlichkeitsfunktion Parkas..um für alle BorELschen Mengen 
des R" (vgl. $ 3). Weiter betrachten wir nur BoRELsche Mengen des R" 
und BorELsche Zylindermengen in E. 

Für jede Zylindermenge 

u 4 u Kı m. „(A ) 
setzen wir 


(4) P(A) = P,, fe. 1m (A) . 


Da dieselbe Zylindermenge A durch verschiedene Mengen 4’ definiert 
werden kann, muß man zuerst beweisen, daß die Formel (4) immer 
denselben Wert für P(A) ergibt. | 
Es sei (%,,, % ++ +» %u,) ein endliches System der zufälligen Größen x, 
Ausgehend von der Wahrscheinlichkeitsfunktion P,, „. dieser zu- 
fälligen Größen können wir nach den Regeln des $ 2 die Wahrscheinlich- 
Ergebnisse der Mathematik. 11/3. Kolmogoroff. 3 


28 IIl. Zufällige Größen. [228 


keitsfunktion Py,a,...u;, Jedes Teilsystems (x.,,%u,,---,%,) be- 
stimmen. Die Gleichungen (2) und (3) haben zur Folge, daß diese nach 
dem $ 2 definierte Wahrscheinlichkeitsfunktion mit der a priori gegebenen 
Funktion Pu; Pays Ai zusammenfällt. Wir setzen jetzt voraus, daß eine 


Zylindermenge A u 

=p,. Mikiz: li, (4’) 
und gleichzeitig durch 
| A= p,, je 1, (A ) 


definiert ist, wobei alle zufälligen € Größen %,, und x,, zum System 


(Kur Kun + 9 Kun) gehören, was offenbar keine wesentliche Einschrän- 
kung ist. Die Bedingungen 
(%u; > Ku, 7) %u,,) cA 
und 
(Fu, ; ar A ) 4" 
sind gleichbedeutend. Es gilt folglich 
Para Bi (A') = Pam... tim (x, Kur %u;,) c a’ 
u Pa, Aa... Kin (u, » Kur ren Kup ) < a7} u Payngren im 4); 


was unsere Behauptung bezüglich der Eindeutigkeit der Definition 
von P(A) beweist. 

Wir wollen jetzt beweisen, daß das Wahrscheinlichkeitsfeld (3, P) 
allen Axiomen I—VI genügt. Das Axiom I behauptet nur, daß 5# 
ein Körper sein soll, diese Tatsache wurde schon oben bewiesen. Es 
gilt weiter bei einem beliebigen u 


E=p,'(R), 
PE)=P.(R)=1, 
was die. Gültigkeit der Axiome II und IV beweist. Es folgt endlich 
unmittelbar aus der Definition von P(A), daß P (A) nicht negativ ist 
(Axiom III). 


Nur wenig komplizierter ist der Beweis der Gültigkeit des Axioms V. 
Zu diesem Zwecke betrachten: wir zwei: Zylindermengen 


A) 


und __ A , 
B —— di, ki, ... (B ) ° 


Dabei setzen wir voraus, daß alle Größen %,, und %,, zu einem umfassen- 
den endlichen System (%,,,%,, - - - %„,) gehören. Wenn die Mengen A 
und B disjunkt sind, so sind die Relationen 

(Kur Kur) CA 


und ‚ 
(Kuzr Ep > Ku) SB 
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unvereinbar. Es gilt folglich 
P(A+B)= Payne. unf (Ku: urn Ku) c 4’ 
oder (Kur pr u) CB} 
= Pam... un (Ku; un %uu,) c 4’) 
+ Pay. unf (Au; Zur u) CB =P(A) + PB). 
Damit ist unser Beweis zu Ende geführt. 
Es bleibt das Axiom VI. Es sei also 
A,>2>A2:.-D> MD: 
eine abnehmende Folge von Zylindermengen mit | 
liimP(A,)=L>0; 


wir wollen beweisen, daß der Durchschnitt aller Mengen A, nicht leer 
ist. Man kann, ohne die Fragestellung wesentlich einzuschränken, 
voraussetzen, daß in der Definition der ersten » Zylindermengen A, 
nur die » ersten Koordinaten x,, einer Folge 


Ks Kur ver Km ne 
vorkommen, d.h. daß 
A Br) 
ist. Wir setzen zur Abkürzung 


Parts. un(D) = P„(B); 
dann ist offenbar 
PB) =PA)=1>0. 
Man kann in jeder Menge B, eine abgeschlossene beschränkte Menge U, 
finden mit 


€ 
P„(Bn — U, = 2 . 


Aus dieser Ungleichung folgt für die Menge 

Veh... um (Un) 
- die Ungleichung 
(4) P(An— Y,)= 
Es sei weiter 

W„=V,ıV; .--- In; 
aus (4) folgt 
P(,—-W,) =E 
und, da W„c=V,c 4A, ist, 
PW,.)=P(A,-e=1-e. 

Ist e klein genug, so ist also P(W,) > 0 und W,„ nicht leer. Wir wählen 


jetzt in jeder Menge W,„ einen Punkt £® mit den Koordinaten x). 


3% 


Jeder Punkt &*tP, 5=0,1,2,..., gehört zur Menge V,, es gilt folglich 


(n+p) „(n+p) (n+P)\ _ „1 (n+p) 
(Ki ’ ’ Ku, u Zu Kun ) — mt... unE )e Un. 


Da die Mengen U, beschränkt sind, kann man (Diagonalverfahren!) 
aus der Folge {£®} eine Teilfolge- 
Em), Em), ..., Em), 
wählen, für welche die entsprechenden Koordinaten x) bei jedem k 
gegen den bestimmten Limites x, konvergieren. Es sei endlich & ein 
Punkt von E mit den Koordinaten 
Kr Hk 
u=0, uFm: k=1,2,3,... 
Der Punkt (%,, %,, ...,%,) gehört als Limes der Folge (x, x, ..., x{r9), 
i=4,2,3,..., zur Menge U,. volglich gehört & zur 
Ach=P, kn. „ur (O8) 
bei jedem k, also auch zur Durchschnittsmenge 
A= Da k- 


$ 5. Äquivalente zufällige Größen, verschiedene Arten der 
Konvergenz. 


Von diesem Paragraphen an betrachten wir ausschließlich BORELSche 
Wahrscheinlichkeitsfelder. Dies bildet, wie schon im $ 2, zweites Kapitel, 
erklärt wurde, keine wesentliche Einschränkung unserer Betrachtungen. 

Zwei zufällige Größen x und y heißen äguwivalent, wenn die Wahr- 
scheinlichkeit der Relation x =#y gleich Null ist. Offenbar haben zwei 
äquivalente zufällige Größen dieselbe Wahrscheinlichkeitsfunktion: 


P@(A) = PW(A). 
Die Verteilungsfunktionen F® und F® fallen folglich auch zusammen. 
In mehreren Fragen der Wahrscheinlichkeitsrechnung kann eine zu- 


fällige Größe durch jede äquivalente Größe ersetzt werden. 
Es sei jetzt 


(1) Ky Kos see, Knı en 


eine Folge von zufälligen Größen. Wir wollen die Menge A aller elemen- 
taren Ereignisse & betrachten, für welche die Folge (1) konvergiert. Wenn 
man mit A%%) die Menge aller £ bezeichnet, in welchen alle Ungleichungen 


Ann — Anl < kR=1,2,...,P 
gelten, so ergibt sich unmittelbar, daß 
(2) A=DSDAY 
mnDp 
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ist. Nach $3 gehört die Menge A" immer zum Mengenkörper %. 
Die Relation (2) zeigt uns, daß auch die Konvergenzmenge A zu % 
gehört. Es hat also immer einen ganz bestimmten Sinn, über die Wahr- 
scheinlichkeit der Konvergenz einer Folge zufälliger Größen zu sprechen. 

Es sei jetzt die Wahrscheinlichkeit P(A) der Konvergenzmenge A 
gleich Eins. Dann behaupten wir, daß die Folge (1) mit der Wahrschein- 
lichkeit Eins gegen eine zufällige Größe x konvergiert, dabei ist die 
zufällige Größe x bis auf Äquivalenz eindeutig bestimmt. Um eine 
solche zufällige Größe zu bestimmen, setzen wir auf A 


x = limx, N— 00 
und x = 0 außerhalb A. Es bleibt uns zu beweisen, daß x eine zufällige 
Größe ist, d.h. daß die Menge A (a) der Elemente £, für welche x <a 
ist, zum Körper % gehört. Es gilt aber 

A(a) = A S Difntp <a}, 
wenn a<0 ist, und 
Ala) = AS Dim, <a} + A 
im entgegengesetzten Falle, woraus unsere Behauptung unmittelbar folgt. 

Wenn die Wahrscheinlichkeit der Konvergenz der Folge (1) gegen x 
gleich Eins ist, so sagen wir, daß (1) fast sicher gegen x konvergiert. 

Doch ist für die Wahrscheinlichkeitsrechnung ein anderer Konver- 
genzbegriff vielleicht noch wichtiger. 

Definition. Eine Folge %,,%g,...,%,,.. .. von zufälligen Größen 
konvergiert nach Wahrscheinlichkeit (converge en probabilite) gegen eine 
zufällige Größe x, wenn bei jedem e>0 die Wahrscheinlichkeit 

Pf —x|>e} 
mit n—0oo gegen Null konvergiert!. | 

I. Wenn die Folge (1) gegen x und gleichzeitig gegen x’ konvergiert, 

so sind x und x’ äquivalent. Es gilt in der Tat 


Pilz — x >#!< Pin — x > + Pin — x] >zuh 


da die letzten Wahrscheinlichkeiten bei einem genügend großen n 
beliebig klein sind, folgt es daraus, daß 


„_Aal_ 
ist; jetzt erhält man schon unmittelbar 


Pe+2}= SD Plix-x] >4l=0. 


1 Dieser Begriff stammt im wesentlichen von BERNOULLI her, wurde jedoch 
in der vollen Allgemeinheit von SLutsky eingeführt (vgl. SLUTSKY [1)). 
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II. Konvergiert die Folge (1) fast sicher gegen x, so konvergiert sie 
gegen x auch nach Wahrscheinlichkeit. Es sei A die Konvergenzmenge 
der Folge (1); dann ist 


1=P(A) <limPlx,,„—-x|<s,d = 0,1,2,..Y=zslimP{|„—x|<e}, 
n>x n>o 


woraus die Konvergenz nach Wahrscheinlichkeit folgt. 

III. Für die Konvergenz nach Wahrscheinlichkeit der Folge (1) ist 
die folgende Bedingung notwendig und hinreichend: Bei jedem e >O0 
existiert ein solches n, daß für jedes p >O die Ungleichung 
gilt. Pflns -m|>g<e 

Es seien jetzt F,(a), Fz(a),...,F„(a),...,F(a) die Verteilungs- 
funktionen der zufälligen Größen %,,%,.--,Xns---,%. Wenn die 
Folge x, nach Wahrscheinlichkeit gegen x konvergiert, so ist die Ver- 
teilungsfunktion F(a) eindeutig durch die Kenntnis der Funktionen 
F,„(a) bestimmt. 

Es gilt in der Tat: | 

Satz. Konvergiert die F olge X» Kar 2:5 Xp. . . nach Wahrscheinlich- 
keit gegen x, so konvergiert die Folge der entsprechenden Verieilungs- 
funktionen F„(a) in jedem Stetigkeitsbunkte von F (a) gegen die V erteilungs- 
funktion F(a) von %. 

Daß F(a) durch die F„(a) wirklich bestimmt ist, folgt daraus, daB 
F(a) als eine nach links stetige monotone Funktion durch ihre Werte 
in den Stetigkeitspunkten eindeutig festgelegt ist!. Zum Beweise des 
Satzes setzen wir voraus, daß a ein Stetigkeitspunkt von F ist. Es 
seia’< a, dann ist im Falle x <a’, x, >= a notwendig |x, — x| > a-a 
Es gilt folglich 
| imP(x<a,x,=a) =0, 

F(a)=P(x<a) <P(„<a)+P(x<a,x„=a)=F,„(a) +Plx<a,.=a), 
F(a’) < lim infF,„(a) +limP(a<a,x,>a), 


(3) F(a’) = lim infF,„(a).. 
Analog beweist man, daß aus a’ >.a die Relation 
(4)  F(a”) = lim supF,(a) 


folgt. Da. F(a’) und F(a’’) mit a —a und a” —a gegen F(a) konver- 
gieren, folgt aus (3) und (4), daß 

himF,„(a) = F (a) 
ist, womit unser Satz bewiesen ist. 


1 Sie hat in der Tat nur eine höchstens abzählbare Menge von Unstetigkeits- 
punkten (vgl. z. B. LEBESGUE: Legons sur l’integration 1928 S. 50). Die Stetig- 
keitspunkte liegen infolgedessen überall dicht, und man bestimmt den Wert der 
Funktion F(a) in einem Unstetigkeitspunkt als Limes ihrer Werte in den nach 
links liegenden Stetigkeitspunkten. 
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Viertes Kapitel. 
Mathematische Erwartungen‘. 


$ 1. Abstrakte LEesescuesche Integrale. 


Es sei x eine zufällige Größe und A eine Menge aus %. Wir bilden 
dann für ein positives m die Summe 


(1) Ss Ihpkasz< (+1, say. 
Wenn diese Reihe bei jedem A absolut konvergiert, so strebt S, mit 
A>0 gegen einen bestimmten Limes, welcher nach Definition das 
Integral Ä 
(2) [ xP(dE) 

A 
ist. In dieser abstrakten Form wurde der Integralbegriff von M. FRECHET 
eingeführt?, sie ist insbesondere für die Wahrscheinlichkeitsrechnung 
unentbehrlich (der Leser wird übrigens im folgenden Paragraphen sehen, 
daß die übliche Definition der bedingten mathematischen Erwartung 
der Größe x unter der Hypothese A bis auf einen konstanten Faktor 
mit der Definition des Integrals (2) zusammenfällt). 

Wir geben hier ein kurzes Verzeichnis der wichtigsten Eigenschaften 
der Integrale von der Form (2). Der Leser findet ihre Beweise in jedem 
Lehrbuch über reelle Funktionen, obwohl sie meistens nur in dem Falle, 
daß P(A) das LeBesGuEsche Maß der Mengen im R" ist, durchgeführt 
sind. Diese Beweise auf den allgemeinen Fall zu übertragen, ist eigent- 
lich keine neue mathematische Aufgabe: sie bleiben meistens wörtlich 
dieselben. 

I. Ist die zufällige Größe x auf A integrierbar, so ist sie auch auf 
jeder Teilmenge A’ von A, welche zu % gehört, integrierbar. 

II. Ist x auf A integrierbar und A in höchstens abzählbar viele 
disjunkte Mengen A, aus % zerlegt, so gilt 


run - Z]»PeB). 


III. Mit x ist immer auch |x| integrierbar, und es gilt dabei 
I[xP(aE) | <[|z|P(aE). 
A A 


1 Wie es im $ 5, drittes Kapitel, erwähnt wurde, betrachten wir in diesem und 
in den folgenden Kapiteln nur BoreLsche Wahrscheinlichkeitsfelder. 

3 FRECHET: Sur l’integrale d’une fonctionnelle etendue & un ensemble abstrait. 
Bull. Soc. Math. France Bd. 43 (1915) S. 248. 
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IV. Wenn in jedem Falle & die Ungleichungen 0=sy=sx erfüllt 
sind, so ist mit x auch y integrierbar! und es gilt dabei Ä 


frras = [xP(aE). 


V. Wenn m <x=<M ist, wobei m und M zwei Konstanten sind, 
so ist | 
mP(A) <|xP(dE) <MP(A). 
Ä 


VI. Sind x und y integrierbar und X und Z zwei reelle Konstanten, 
so ist auch XÄx + Ly integrierbar, und es gilt dabei 


[ex + Ly)P(dE) = K|xP(dE) + L[yP(aE). 
4A 4A 4A 


VII. Ist die Reihe 
I [Im] P(@E) 
na 
konvergent, so konvergiert die Reihe 
Dm=% 
n 


in jedem Punkt der Menge A bis auf eine Menge B mit P(B) = 0. Setzt 
man außerhalb .A — B überall x = 0, so ist 


Jraz) = /mP(aB). 


VIII. Sind x und y äquivalent (P{x + y}=0), so ist für jede 
Menge A aus % 
3) [xP(@E) = [yP(@E). 

ä ä 

IX. Gilt (3) für jede Menge A aus %, so sind x und y äquivalent. 

Der obigen Definition des Integrals entnimmt man noch die folgende 
Eigenschaft, welche man in der gewöhnlichen LEBEsGUEschen Theorie 
nicht hat: | 

X. Es seien P,(A) und P,(A) zwei Wahrscheinlichkeitsfunktionen, 
welche auf demselben % definiert. sind, P(A) = P,(A) + Ps,(A) und x 
in bezug auf P,(4) und P,(A) auf A integrierbar. Dann gilt 


[rr@e)=/ »P,(dE) + [xP,(dE). 
A A A 


XI. Jede beschränkte zufällige Größe ist integrierbar. 


1 Man setzt dabei voraus, daß y eine zufällige Größe ist, d. h. in der Terminologie 
der allgemeinen Integrationstheorie in bezug auf % meßbar ist. 
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$ 2. Absolute und bedingte mathematische Erwartungen. 
Es sei x eine zufällige Größe. Das Integral 
E(x) = [xP(dE) 

E | 
nennt man in der Wahrscheinlichkeitsrechnung die mathematische Er- 
wartung der Größe x. Es folgt aus den Eigenschaften III, IV, V, VL 
VII, VIII, XI, daß 

1. |E@I=E(L2): 
II. E(/) =E(x), wenn immer 0=y=« ıst; 
II. inf(x) <E(x) <sup(«); 
IV. E(Kx+Ly)=KE() +_LE(y); 
V.E (Zr) = DE(x,), wenn die Reihe S>E(|x,|) konvergiert. 


VI. Sind x und y äquivalent, so ist 


E@) = Ey). 
VII. jede beschränkte zufällige Größe besitzt eine bestimmte 
mathematische Erwartung. 
Man hat nach der Definition des Integrals 


k=+% . 
E(x) = lim I km Plkm<x< (k +4 1) m} 
k=-—-o 


k= °o 
— lim I’ km{F((k + 1),m). — F(km)}. 
k=- = 009 


Die zweite Zeile ist nichts anderes als die übliche Definition des STIELT- 
JEesschen Integrals | 
+00 

(1) | adF® (a) =E(x). 
Die Formel (1) könnte folglich auch als Definition der Erwartung E (x) 
dienen. | | 

Es sei jetzt eine Funktion des elementaren Ereignisses & und x 
eine zufällige Größe, welche als eine eindeutige Funktion x = x(w) 
von “ definiert ist. Dann ist 


Pikmsx<(k-+4)m} _ Poikm<x(u) <(k+1)m}, 


wobei P@ (4A) die Wahrscheinlichkeitsfunktion von w ist. Es folgt 
mithin aus der Definition des Integrals, daß 


[xP(@E) = [x P@(dE@) 
E Eiw 
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und folglich 
Ve E(x) = | x(u) PO(dE@) 
Em 

ist, wobei E% die Menge aller möglichen Werte von % bedeutet. 

Wenn insbesondere # selbst eine zufällige Größe ist, so hat man 

+00 
(3) E(x) = [ xP(dE) = [ x(u) PW(dR!) = f x(a) AFW (a). 
E R! -009 

Das letzte Integral in der Formel (2) ist im Falle einer stetigen Funktion 
%(u) ein gewöhnliches STIELTJESsches Integral. Es sei aber dabei be- 


merkt, daß das Integral 
+00. 


[ra ar®() 
auch im Falle der Nichtexistenz der mathematischen Erwartung E (x) 
existieren kann: für die Existenz von E(x) ist die Endlichkeit des 
Integrals +00 


fIx(a|aF® (a) 


notwendig und hinreichend!. 
Ist ein Punkt (u,, %,...,%,) des R", so ist wegen (2) 


(4) E (x) = (|. (xt, Ugs 22: 4y) Pan un sum (ARM). 
Rr 


Wir haben schon gesehen, daß die bedingte Wahrscheinlichkeit 
P,z(A) alle Eigenschaften einer Wahrscheinlichkeitsfunktion besitzt. 
Das entsprechende Integral 
(5) En(x) = [x Pa(dE) 

E 
nennen wir die bedingte mathematische Erwartung der zufälligen Größe x 
in bezug auf das Ereignis B. Da 


B 
ist, folgt aus (5) die Gleichung 


Es(x) = [x P,„(dE) = [x P,(dE) + [x P,(dE) = [x P,(dE). 
E B B B 


Erinnert man sich, daß im Falle ACB 


P„ (a) = AB) _ PA) 


PB)  PIiB) 





ı Vgl. V. GLivEenko: Sur les valeurs probables de fonctions. Rend. Accad. 
Lincei Bd. 8 (1928) S. 480—483. 
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ist, so erhält man 
1 
(6 En(e) = pi; |* Pl), 
B 


(7) / xP(dE) = P(B)E,(). 


B 
Aus (6) und der Gleichung 


[zP(@E) = [xP(aE) + [xP(aE) 
A+B Ä B 
folgt schließlich 

P(A)E4 P(B)E; 
(8) urn) = Dan je) Gy 








Es gilt insbesondere die Formel 


(9) E@) =P(AEw) + P(A) Ei). 


$ 3. Die TcHEBycHEFFsche Ungleichung. 


Es sei /(x) eine nichtnegative Funktion eines reellen Argumentes x, 
welche bei x >= a immer nicht kleiner als 5 > 0 bleibt. Dann ist für 
jede zufällige Größe x 


(1) p > a) < <-uen, 


wenn nur die mathematische Erwartung E{/(x)} existiert. Man hat 
in der Tat 
Effi} = ‚Ir@Pan )>[f@)P(4E) =bP«>a), 
{72a} 
woraus (1) anmittelbar folgt. 
Es gilt z.B. für jedes positive e 


(2) Pr=a)s-N. 





Es sei jetzt f(x) nichtnegativ, gerade und bei positivem & nicht 
abnehmend. Dann gilt für jede zufällige Größe x und bei jeder Wahl 
der Konstante a >0 die Ungleichung 


() AUEDES 
Insbesondere gilt 
(4) P(ix—-Em|> a) < ee el. 


/(a) 
Besonders wichtig ist der Fall /(x) = x*. In diesem Fall erhält man aus 
(3) und (4) 


(5) P(x|> a = 
er _ EN _ 


E(#°?) 


rn} 





(6) P(\x — E@)|> a) = 
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Man nennt dabei 02(x) = Efx — E(ia)" 
die Streuung der Größe x. Es läßt sich leicht berechnen, daß 


ist. 0?(x) = E(x2) — {E (x)? 


Ist f(x) beschränkt: 
Yal=K, 


so kann man P(|x| > a) auch nach unten abschätzen. Es gilt in der Tat 
E(f(x)) = [1 P(dE) = [ f(x) P(dE) + | 1x) P(@E) 
{l2I1<a} {2l2a} 
<f(aaP(ix|<a)+KP(ixl>a)=f(a) +KP(lx|= a) 
und folglich 


(7 P(x|> a) = U Ne) 


Ist statt /(x) die zufällige Größe x selbst beschränkt: 
2l=<M, 
so ist /(x) =/{M), und man erhält statt (7) die Formel 
Em) — Ma) 


(8) P(x]|=a> AM) 
Im Fall /(x) = x? ergibt sich aus (8) 
() (ala) 2ER *. 


$ 4. Einige Konvergenzkriterien. 

Es sei 
(1) | Ks Kay eren Ans eo 
eine Folge von zufälligen Größen und /(x) eine nichtnegative, gerade 
und bei positiven x monoton wachsende Funktion!. Dann gelten die 
folgenden Sätze: 

I. Für die Konvergenz nach Wahrscheinlichkeit der Folge (1) ist 
die folgende Bedingung hinreichend: Zu jedem e>0 existiert ein 
solches », daß für jedes # > 0 die Ungleichung 
(2) Elf(än4» — Ku)} <e 
gilt. 

II. Für die Konvergenz nach Wahrscheinlichkeit der Folge {1) 
gegen die zufällige Größe x ist die Bedingung 
6) lim E{ft, — 2} = 0 

n> oo 
hinreichend. 


ı Es ist also /(x) >0, falls x # 0 ist. 
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III. Ist /(x) beschränkt und stetig und /(0) = 0, so sind die Be- 
dingungen I und II auch notwendig. 
_ W. Ist f(x) stetig, /(0) =0 und alle %,,%,.. .,%.,.. .,% in ihrer 
Gesamtheit beschränkt, so sind die Bedingungen I und II auch not- 
wendig. | 

Aus II und IV folgt insbesondere 

V. Für die Konvergenz nach Wahrscheinlichkeit der Folge (1) 
gegen x ist die Bedingung 
(4) limE (x, — x)? = 0 
hinreichend. Sind dabei x%,,%9,.. .,%,,- - ., % in ihrer Gesamtheit be- 
schränkt, so ist diese Bedingung auch notwendig. 

Zum Beweis von I—IV vgl. SLutsky [1] und FRECHET [1]. Diese 
Sätze folgen übrigens fast unmittelbar aus den Formeln (3) und (8) 
des vorigen Paragraphen. 


8$ 5. Differentiation und Integration der mathematischen 
Erwartungen nach einem Parameter. 


Ist jedem elementaren Ereignis & eine bestimmte reelle Funktion 
x(f) eines reellen Argumentes i zugeordnet, so sagen wir, daß x(f) eine 
zufällige Funktion ist, wenn bei jedem festen # die Größe x(f) eine zu- 
fällige Größe.ist. Es entsteht dann die Frage, unter welchen Bedingungen 
das Erwartungszeichen E mit den Integrations- und Differentiations- 
zeichen vertauschbar ist. Zwei folgende Sätze, ohne die Frage zu er- 
schöpfen, können in mehreren einfachen Fällen eine befriedigende Ant- 
wort auf diese Frage geben: 

SatzI. Ist die mathematische Erwartung E[x (£)] für jedes # endlich, 
%(t) immer für jedes # differentiierbar und die Ableitung x’(f) von x(£) 
nach ? dem Betrage nach immer kleiner als eine feste Konstante M, 


so ist 2 E(x(t)) =E(#(t)). 


SatzII. Ist x(£) dem Betrage nach immer kleiner als eine feste 
Konstante K und nach RIEMANnN integrierbar, so ist 


b b 
jew) dt= | [et | 


a a 
wenn nur E(x(£)) im RıEMAnnschen- Sinne integrierbar ist. 
Beweis des SatzesI. Es ist zuerst zu bemerken, daß x’(f) als 
Limes der zufälligen Größen 
| u4Nn-) ,_, 1 1 
h 


1, 72°’ .., n’ ... 
eine zufällige Größe ist. Da x’ (k) beschränkt ist, existiert die mathe- 
matische Erwartung E(x’(t)) (Eigenschaft VII der mathematischen Er- 
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wartungen aus $ 2). Wir wählen jetzt ein festes ? und bezeichnen mit A 
das Ereignis 


Amzal _ rW|>e. 
Die Wahrscheinlichkeit P(A) konvergiert mit h>0 gegen Null für 
jedes e>0. Da immer | 
14 h — 14 N 
ern. welch 

ist und außerdem im Falle A 

EN N _yw|ce 
gilt, so hat man 

Ex(t+h) —- Extt ‚ _Iz(i+h) — xt ,,. 
Beet _erg|selt td vo 


— P(A) a — +) | + P(4) Fi — “| 


=<2MP(A)-+e. 


€e>0 kann man dabei beliebig wählen, und P(A) ist bei jedem genügend 
kleinen A beliebig klein. Es gilt folglich 


Ex) = lim tt EU _ Ey, 
h>0 


w. z.b. w. 
Beweis des SatzesII. Es sei 





n 
k=1 


k=h 
1 b— 
=; > +t+km, h=-—. 
b 


Da S, gegen ] = [ x(t)dt konvergiert, so kann man für jedes e>0 
a 
ein solches N wählen, daß aus n= N die Ungleichung 
| PA=P(Ss-J|>d}<e 
folgt. Setzt man | 
2 
1 
St — ED Ex(t+kh)=E(S,), 
k=1 
Sr — E()| un |E(Sn — N = E|S„ Ku J\ 
= P(A)EAISn— J| + PER m — Jı=2KP(A)+e=(2K +1)e. 
Somit konvergiert S} gegen E(J), woraus die Gleichung 


so wird 


b 
| [Ex@ dt = limS*=E()J) 
folgt. . 
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Der Satz II kann ohne jede neue Schwierigkeit für die zwei- und 
mehrfachen Integrale erweitert werden. Wir wollen eine Anwendung 
dieses Satzes auf ein Problem der geometrischen Wahrscheinlichkeiten 
geben. Es sei G ein quadrierbares Gebiet der Ebene, dessen Gestalt 
vom Zufall abhängt, d. h. es sei jedem Elementarereignis & eines Wahr- 
scheinlichkeitsfeldes ein bestimmtes quadrierbares Gebiet G der Ebene 
zugeordnet. Wir bezeichnen mit / den Inhalt des Gebietes G und mit 
P(x,y) die Wahrscheinlichkeit, daß der Punkt (x,y) zum Gebiet G 


gehört. Dann ist E()) = [ [P(x,y) dxdy. 
Um dies zu beweisen, genügt es, zu bemerken, daß 
J= [It y)dxdy, 
P(x,y) = Ef(x,y) 


ist, wobei /(x,y) die charakteristische Funktion des Gebietes G ist 
((x,y) =1 auf G und f(x, y) außerhalb G)!. 


Fünftes Kapitel. 


Bedingte Wahrscheinlichkeiten 
und Erwartungen. 


$ 1. Bedingte Wahrscheinlichkeiten. 


Wir haben im ersten Kapitel, $6 die bedingte Wahrscheinlichkeit 
Pur (B) eines Ereignisses B nach einem Versuch X definiert. Es wurde 
dabei im ersten Kapitel vorausgesetzt, daß A nur endlichviele ver- 
schiedene mögliche Ausgänge hat. Man kann aber P„(B) auch im Falle 
eines Versuches X mit einer unendlichen Menge der möglichen Ausgänge, 
d.h. einer Zerlegung der Menge E in unendlichviele disjunkte Teil- 
mengen, definieren. Eine solche Zerlegung erhält man insbesondere, 
wenn man eine beliebige Funktion # von & betrachtet und die Mengen 
u = const als Elemente der Zerlegung X, definiert. Die bedingte Wahr- 
scheinlichkeit Py,(B) wird auch mit P,(B) bezeichnet. Eine beliebige 
Zerlegung A der Menge E erhält man als die Zerlegung W,, welche durch 
eine Funktion # von & ‚induziert‘ ist, wenn man jedem & diejenige 
Menge der Zerlegung W als #(&) zuordnet, welche & enthält. 

Zwei Funktionen «: und #’ von & bestimmen dann und nur dann 
dieselbe Zerlegung W, = W,, der Menge E, wenn eine solche einein- 
deutige Zuordnung #’ = f(u) ihrer Wertebereiche 5% und %? existiert, 
daß identisch #’(&) = fu(&) ist. Der Leser kann leicht nachprüfen, 


ı Vgl. A. KoLMoGororF u. M. A. LEoNnTowItscH: Physik. Z. Sowjetunion. 
Im Druck (1933). 
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daß die im folgenden definierten zufälligen Größen P,(B) und P,(B) in 
diesem Falle zusammenfallen, sie sind also wirklich durch die Zerlegung 
A, >= A, selbst bestimmt. 

Man kann zur Definition von P,(B) die folgende Gleichung brauchen: 


(1) Prue43(B) = Eger Pu(B)- 


Man könnte leicht zeigen, daß im Falle einer endlichen Menge E@) der 
möglichen Werte von # die Gleichung (1) bei jeder Wahl der Menge A 
erfüllt ist (wobei P,(B) nach $ 6, erstes Kapitel definiert ist). Im all- 
gemeinen Falle (in welchem P,(B) noch nicht definiert ist) beweisen 
wir, daß immer eine und bis auf Äquivalenz nur eine zufällige Größe 
P,(B) existiert, welche als Funktion von « sich bestimmen läßt und 
bei jeder Wahl von A mit P®(A)>0 aus %% der Gleichung (1) 
genügt. Die somit bis auf Äquivalenz bestimmie Funktion P,(B) von u 
nennen wir die bedingte Wahrscheinlichkeit von B in bezug auf u (oder 
bei bekanntem #). Den Wert von P,(B) bei = bezeichnen wir 
dabei mit P,„(a; B). 

Beweis der Existenz und Eindeutigkeit von P,(B). Multi- 
pliziert man (1) mit P{fuc A} = PW(A), so erhält man links 


Pluc A}Py.4a(B) =P(B{ucA)=P(Bu!(A) 
und rechts 
Pfu c A}EqeurPu( )= [PC P,(B) P(dE) = [P.B) B) PW(dE®). 
{uc4} 


Es ergibt sich also die Formel 
(2) P(Bu-!(4)) = [ P,(B) P®(dE®). 
ä 


Umgekehrt folgt aus (2) die Formel (1). Im Falle Pw(A) = 0, in welchem 
(1) keinen Sinn hat, ist (2) in trivialer Weise richtig. Die Forderung (2) 
ist also mit (1) äquivalent. 

Nach der Eigenschaft IX des Integrals (viertes Kap., $1) ist eine 
zufällige Größe x durch die Werte des Integrals 


[ xP(dE) 

A 
für alle. Mengen aus % bis auf Äquivalenz eindeutig bestimmt. Da 
P„(B) eine auf dem Wahrscheinlichkeitsfelde (53®, P®) bestimmte zu- 
fällige Größe ist, so folgt daraus, daß die Formel (2 ) diese Größe P,(B) 
bis auf Äquivalenz eindeutig bestimmt. 

Es bleibt uns die Existenz von P,(B) zu beweisen. Zu diesem Zwecke 
brauchen wir den folgenden Satz von O. NıkopyMm!: 


ı Nıkopym, O.: Fundam. Math. Bd. 15 (1930) S. 168 (Theoreme III). 
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Es sei % ein BorELscher Mengenkörper, P(A) eine auf % definierte 
nichtnegative vollständig additive Mengenfunktion (in der wahrschein- 
lichkeitstheoretischen Terminologie — eine zufällige Größe auf (%, P)) 
und O(A) eine zweite auf % definierte vollständig additive Mengen- 
funktion, wobei aus O(A) =+0 die Ungleichung P(A) >0 folgt. Es 
existiert dann eine in bezug auf % meßbare Funktion /(£) (in der wahr- 
scheinlichkeitstheoretischen Terminologie — eine zufällige Größe), welche 
für jede Menge A aus % der Gleichung 


0(4) = [f(&) P(dE) 
A 


genügt. 

Um diesen Satz in unserem Falle anwenden zu können, bleibt es 
zu zeigen: 1° daß 

0(4) =P(Bu-!(A)) | 

auf 3% vollständig additiv ist, 2° daß aus Q(A) + 0 die Ungleichung 
P@w(A) >0 folgt. 

Zunächst folgt 2° aus 

0o<P(Bu-!(A)) <= P(u!(A)) =PW(A). 

Um 1° zu beweisen, setzen wir 


A= ZA 
Dann ist " 
u-1(4) = Du!(A,) 
und “ 
Bu-!(4)=DBu!(A,). 


Da P vollständig additiv ist, so folgt daraus, daß 
P(Bu-!(A,)) = ZP(Bu'(4,)) 
n 
ist, w. z.b. w. 
Aus der Gleichung (1) folgt insbesondere (wenn man A = E“ 
setzt) die wichtige Formel 
(3) P(B)=E(P.(B)). 
Wir wollen jetzt zum Beweise der zwei folgenden fundamentalen 
Eigenschaften von bedingten Wahrscheinlichkeiten übergehen: 
Satz I. Es ist fast sicher, daß 
(4) 0=P,(B) =s1 
ist. 
Satz II. Ist B in die höchstens abzählbar vielen Summen den D, 
zerlegt: 
B=%B 
n 


Ergebnisse der Mathematik. 11/3. Kolmögoroff. 4 
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so gilt fast sicher die Gleichung 
(5) Py (B) = >» Py (B 
n 


Diese zwei Eigenschaften von P,(B) entsprechen den zwei charakte- 
ristischen Eigenschaften der Wahrscheinlichkeitsfunktion P(B): es ist 
immer O=P(B)=s#, und P(B) ist vollständig additiv. Sie gestatten, 
mehrere weitere wesentliche Eigenschaften der absoluten Wahrschein- 
lichkeiten P(B) auf die bedingten Wahrscheinlichkeiten P,(B) zu über- 
tragen. Man soll dabei jedoch nicht vergessen, daß P,(B) bei einer 
festen Menge B eine nur bis auf Äquivalenz bestimmte zufällige Größe ist. 

Beweis des Satzes I. Setzen wir voraus — im Gegensatz zu der 
zu beweisenden Behauptung —, daß auf einer Menge MCE® mit 
P®(M) > 0 die Ungleichung P,(B)=1-+e, e>0, erfüllt ist, so ist 
nach der Formel (1) 

Puemy(B) = Erue m} P„(B) Ai te, 
was offenbar unmöglich ist. Ebenso beweist man, daß fast sicher 
P,B)=>0 ist. 
Beweis des Satzes II. Aus der Be der Reihe 


folgt wegen der Eigenschaft V der mathematischen Erwartungen 
(viertes Kap., $ 2), daß die Reihe 


2 Pu(B.) 
n 
fast sicher konvergiert. Da die Reihe 


2 Eruc 43 Pu (Bn)| = 2 Eue4) (P,(B,)) = 2 Pyue ar (Br) = Pe 4y(B) 


bei jeder Wahl der Menge A mit P®W(A) > 0 konvergiert, so folgt aus 
der erwähnten Eigenschaft V der mathematischen Erwartungen, daß 
für jede Menge A der erwähnten Art die Relation 


Eve 4} (2 Pu(Bn)) = 2 Etuc 4) (P,(3,)) = Pyuc 4,(B) = Eruc 4} (P,(B,)) 


gilt; daraus folgt die Gleichung (5) unmittelbar. 

Zum Schluß dieses Paragraphen wollen wir auf zwei Spezialfälle 
hinweisen. Ist erstens #(£) =c eine Konstante, so gilt fast sicher 
P.(4) = P(A). Setzt man dagegen u(£) = £, so erhält man sogleich, 
daß P,(A) auf A fast sicher gleich Eins und auf A fast sicher gleich 
Null ist. P,;(A) ist also die charakteristische Funktion der Menge A. 


$ 2. Erklärung eines Boreıschen Paradoxons. 


Es sei die Menge aller Punkte einer Kugelfläche zur Grundmenge E 
gewählt. Als % wählen wir die Gesamtheit aller BorELschen Mengen 
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der Kugelflächen. Endlich sei P(A) dem Inhalt der Menge A propor- 
tional. Wir wählen jetzt zwei diametrale Punkte zu Polen, dann ist 
jeder Meridiankreis durch die entsprechende geographische Länge 
v,o<syw<.r, eindeutig bestimmt. Da y nur von O bis r läuft, wir 
also.volle Meridiankreise (nicht Halbkreise) betrachten, muß auch die 


Breite ® von —r bis +7 [nicht von -5 bis + =) laufen. Die von BOREL 
gestellte Aufgabe ist: die „bedingte Wahrscheinlichkeitsverteilung‘“ für 


die Breite 9, -_ an <©9< +n, bei bekannter Länge y zu bestimmen. 
Man berechnet leicht, daß 


9 
P,{9, = @< 9,}=}||cos0|d® 
6, 


ist. Die Wahrscheinlichkeitsverteilung für © bei bekanntem % ist also 
nicht homogen. 

Setzt man voraus, daß die bedingte Wahrscheinlichkeitsverteilung 
für © ‚bei der Hypothese, daß & auf dem gegebenen Meridiankreis 
liegt“, homogen sein soll, so erhält man einen Widerspruch. 

Dieser Umstand zeigt, daß der Begriff der bedingten Wahrscheinlich- 
keit in bezug auf eine isoliert gegebene Hypothese, deren Wahrscheinlich- 
keit gleich Null ist, unzulässig ist: nur dann erhält man auf einem 
Meridiankreis eine Wahrscheinlichkeitsverteilung für ©, wenn dieser 
Meridiankreis als Element der Zerlegung der ganzen Kugelfläche in 
Meridiankreise mit den gegebenen Polen betrachtet wird. 


$ 3. Bedingte Wahrscheinlichkeiten in bezug auf eine 
zufällige Größe. 


Ist x eine zufällige Größe und P,(B) als Funktion von x im BOREL- 
schen Sinne meßbar, so kann man P,(B) auch elementar definieren. 
Man könnte in der Tat der Formel (2), $1 die folgende Gestalt geben: 


(1) P(B)PP(A) = [P.(B)P@(dE). 
A 

In unserem Falle ergibt sich unmittelbar aus (1), daß 
@G 

(2) P(B) F$(a) = [P.(a; B)dF® (a) 


ist. Nach einem Satz von LEBESGUE! folgt aus (2), daß 


Fa (a + h) — F7' (a) 
F®(a+h)— F”(a) 


ist, bis auf eine Menge H der Punkte a mit P®(H) = 0. 





(3) P,(a; B) = P(B) lim 


1 LEBESGUE: Legons sur l’integration, S. 301— 302. 1928. 
4* 
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P,(a;B) wurde im $1 nur bis auf eine Menge G mit P®(G) =0 
definiert. Betrachtet man jetzt die Formel (3) als Definition von 
P,(a; B), wobei im Falle der Nichtexistenz des Limes auf der rechten 
Seite von (3) P,(a; B) = 0 gesetzt ist, so genügt diese neue Größe allen 
Forderungen des $ 1. 

Existieren noch die Wahrscheinlichkeitsdichten f®(a) und /@(a) 
und ist /®(a) > 0, so verwandelt sich die Formel (3) in die folgende: 


lz (a) 
f? (a) 
Es folgt noch aus der Formel (3), daß die Existenz des Limes (3) und 
der Wahrscheinlichkeitsdichte (a) die Existenz von f®(a) zur Folge 
hat. Es ist dabei 
(5) P(B) fa (a) = (a). 
Ist P(B) > 0, so folgt aus (4) die Gleichung 
| far — Pxla; B) F? (a) 
(6) B (a) = — PB) 
Im Falle (a) = 0 ist nach (5) /%(«a) = 0, und folglich ist (6) auch 
richtig. Ist dabei die Verteilung von x. stetig, so hat man 





(4) P.(a; B) = P(B) 


+00 +00 
() PB) =E(P.(B)) = [P.(a; B)dF@ (a) = [P.(a; B) fo (a) da. 


Aus (6) und (7) ergibt sich 


(8) 2 (a) = BELIEF MACHEN 


TP.ta; B) rla) da 


In dieser Gleichung haben wir den sog. BayzEsschen Satz für die stetigen 
Verteilungen erhalten. Die Voraussetzungen, unter welchen dieser Satz 
bewiesen ist, sind also die folgenden: P,(B) ist im BorELschen Sinne 
meßbar und im Punkte a nach der Formel (3) bestimmt, die Verteilung 
von x ist stetig und die Wahrscheinlichkeitsdichte /(”(a) im Punkte a 
existiert. 


$ 4, Bedingte mathematische Erwartungen. 


Es seien u eine beliebige Funktion von & und y eine zufällige Größe. 
Eine zufällige Größe E,(y), welche als Funktion von « darstellbar ist 
und für jede Menge A aus %% mit P®(A) > 0 die Bedingung 


(1) Eine 4} (y) = Etuc 4} Eu(y) 


erfüllt, heißt (falls sie existiert) bedingte mathematische Erwartung der 
Größe y bei bekanntem Wert von u. 





Multipliziert man (1) mit P®(A), so erhält man 


(2) [yPiaE) = [Eu) P@ (Em). 

| füc4}. 4 
Umgekehrt folgt aus (2) die Formel (1). Im Falle P®w(A) = 0, in welchem 
(1) keinen Sinn hat, ist (2) in trivialer Weise richtig. Ebenso wie im 
Falle der bedingten Wahrscheinlichkeit (vgl. $4) beweist man, daß 
E,(y) durch (2) bis auf Äquivalenz eindeutig bestimmt ist. 

Der Wert von E,(y) bei «= bezeichnen wir mit E,(a;y). Es 
sei noch bemerkt, daß E,(y) ebenso wie P,(y) nur von der Zerlegung W,, 
abhängig ist, und kann also als Ey,(y) bezeichnet werden. 

In der Definition von E,(y) ist schon die Existenz von E(y) voraus- 
gesetzt (man setze A=E®, dann ist Ey.4,(9) =E(W)); wir wollen 
jetzt beweisen, daß die Existenz von E(y) für die Existenz von E,(y) auch 
hinreichend ist. Dazu genügt es, nach dem Satz von O. NıkopyM (vgl. 
$4) zu beweisen, daß die Mengenfunktion 


Q(4) = [yP(dE) 
{uc 4} 
auf FW vollständig additiv und in bezug auf P(W(A) total stetig ist. 
Die erste Tatsache beweist man wörtlich so wie im Falle der bedingten 
Wahrscheinlichkeiten (vgl. $1). Die zweite Forderung der Total- 
stetigkeit besteht darin, daß aus O(A) +0 die Ungleichung Pw(A) >0 
folgen soll. Setzt man voraus, daß PW(A)=Pf{fuc A}=0 ist, so ist 
offenbar 
Q(4)=[yP(dE)=0. 
{uc 4} 
Unsere zweite Forderung ist also auch erfüllt. 
Setzt man in der Gleichung (1) A = E®, so ergibt sich die Formel 


(3) EW)=EE(). 
Man beweist weiter, daß fast sicher 
(4) Eu(ay + bz) = aE,(y) + BE, (2) 


ist, wobei a und 5 zwei beliebige Konstanten sind. (Die Durchführung 
des Beweises kann dem Leser überlassen bleiben.) 

Sind # und v zwei Funktionen des Elementarereignisses &, so kann 
das Paar (%,v) auch als eine Funktion von & betrachtet werden. Es 
gilt dann die folgende wichtige Gleichung: 


(5) Eu Eu) (y) = Ey (y) . 
In der Tat ist E,(y) durch die Relation 
Eye 4} (y) = Eiue 4A} E, (y). 
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definiert. Man soll also beweisen, daß E,E«..(y) der Gleichung 


(6) | Egue 4} (y) — Erue 4A} E, E(u,o) (y) 
genügt. Aus der Definition von E„,.,(y) folgt 

(7) Erue 43(Y) = Egue 4} Eu,o) (y). 
Aus der Definition von E,E„,.,(Y) folgt weiter, daß 
(8) Eiue 4} E(u,o) (y ) = Egue4} Eu Ewu,o) (y) 


ist. Die Gleichungen (7) und (8) haben die Gleichung (6) zur Folge, 
womit unsere Behauptung bewiesen ist. 

Setzt man y= P;(B) auf B gleich Eins und außerhalb B gleich Null, 
it Ey) = PuB), 

Euw)(y) = Pun(B). 
In diesem Falle ergibt sich aus (5) die Formel 
(9) E„R (u,v) (B) = Pa) (B) . 
Man kann die bedingte mathematische Erwartung E,(y) auch direkt 


durch die entsprechenden bedingten Wahrscheinlichkeiten definieren. 
Man betrachtet zu diesem Zweck die folgenden Summen: 


(10) S,(u) = HP {hl y< +12} =ZRı. 


Ist E(y) bestimmt, so konvergiert die Reihe (10) fast sicher. Es gilt 
in der Tat nach der Formel (3) des $1 


E|Rı| = |RA|P{kASy<(k+1)A}, 
und die Konvergenz der Reihe 


k=+o 
„ZlrlPt<y<@+Nna}-ZEIR, 


ist die notwendige Bedingung der Existenz von E(y) (vgl. viertes Kap., 
$ 1). Aus dieser Konvergenz folgt, daß die Reihe (10) fast sicher konver- 
giert (vgl. viertes Kap., $2, V). Man beweist weiter ebenso wie in der 
Theorie der LEBESGUEschen Integrale, daß aus der Konvergenz von 
(10) bei irgendeinem A die Konvergenz bei jedem A folgt und daß im 
Falle der Konvergenz der Reihe (10) S,(w) mit A—>0 gegen einen be- 
stimmten Limes konvergiert!. Man kann dann definitionsgemäß 


(11) Eu(y) = IimS; (u) 


setzen. Um zu beweisen, daß die durch (11) definierte bedingte Erwar- 
tung E,„(y) den früher aufgestellten Forderungen genügt, braucht man 


! Dabei betrachten wir nur eine abzählbare Folge von A-Werten: alle Wahr- 
scheinlichkeiten P,frA<y< (k + 1)A} sind dann für alle diese Werte von 
A fast sicher bestimmt. 


EEE 
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nur die Geltung der Gleichung (1) für die nach (11) definierte Größe 
E,(y) zu verifizieren. Dieser Beweis verläuft folgendermaßen: 


Eger Eu(y) = lim  Eue.4} Silu) 


—= lim SS rapgesfklsy<(k+1) )A} = Eye 4,()) 


>00 k=—-o 


Bei dieser Rechnung ist die Vertauschung des Erwartungs- und Limes- 
_ zeichens berechtigt, da S;(w) mit A> 0 gleichmäßig gegen E,„(y) Kon- 
vergiert (eine einfache Folge der Eigenschaft V der mathematischen 
Erwartungen aus $2). Die Vertauschung des Erwartungszeichens mit 
dem Summenzeichen ist ebenfalls berechtigt, da die Reihe 


k=-+% 
»> Eucay{|kA| Pı[RR<y<(R+1)A} 
k= 
= Er AlPueslkA<y<(k-+1)A] 


konvergent ist direkte Anwendung der Eigenschaft V der mathemati- 
schen Erwartungen!). 
Man könnte statt (11) 


12) Eu(y) = [yPu(@E) 
E 


schreiben, man darf aber dabei nicht vergessen, daß (12) kein Integral 
im Sinne des vierten Kapitels, $ 1 ist. so daß (12) nur eine symbolische 
Bezeichnung ist. | 

Ist x eine zufällige Größe, so nennen wir die Funktion von x und a 


F% (a) = P,(y <a) 


die bedingte Verteilungsfunktion von y bei bekanntem x. F}'(a) ist bei 
jedem a fast sicher bestimmt. Ist a</b, so ist fast sicher 


F®Y(a) <FY(b). 
Aus (11) und (10) folgt, daß fast sicher 


(13) Eu (y) = lim  IhArP(R+ Da) - — F® (k})] 


ist!, Diese Tatsache kann man symbolisch durch die Formel 


+00 


(14) E,(y) = [adF% (a) 


008 


ausdrücken. 


a Vgl. Fußnote 1 auf Seite 48. 


50 VI. Unabhängigkeit. Gesetz der großen Zahlen. [250 


Mit Hilfe der neuen Definition (10 —11) der mathematischen 
Erwartung beweist man noch leicht, daß für eine reelle Funktion von % 


(15) Eu[/(u) y] = (u) Eu) 


1st. 


Sechstes Kapitel. 
Unabhängigkeit. 
Gesetz der großen Zahlen. 


$1. Unabhängigkeit. 


Definition 1. Zwei Funktionen %# und v von & sind gegenseitig 
unabhängig, wenn für je zwei Mengen A aus %% und B aus %” die 
folgende Gleichung gilt: 

(1) PucA,vcB)=P(uwcA)PlwcB)=PW(A)P®(B). 

Bestehen die Mengen E® und E® nur aus endlichvielen Elementen 

EW =u, +%+ ... + U, 

E® =u tut: + un 
so fällt unsere Definition der Unabhängigkeit von % und v mit der 
Definition der Unabhängigkeit der Zerlegungen 


E = 1 =}, 
E = 20 = vu} 


‚nach dem ersten Kapitel, $5 zusammen. | 

Für die Unabhängigkeit von u und v ist die folgende Bedingung 
notwendig und hinreichend: Bei jeder Wahl der Menge A aus %% ist 
die Gleichung 


(2) P,uc4)=P(ucA) 
fast sicher erfüllt. 

Im Falle P®(B) = 0.sind in der Tat beide Gleichungen (1) und (2) 
erfüllt, es genügt folglich ihre Äquivalenz im Falle PO(B) >0 zu be- 
weisen. In diesem Falle ist (1) mit | 


(3) Pncs,(uc A) =PlucA) 
und folglich mit 
(4) Enemy P, ucA)=PlucA) 


äquivalent. Man sieht andererseits, daß aus (2) die Gleichung (4) folgt. 
Umgekehrt, da P,(u < A) durch (4) bis auf die Wahrscheinlichkeit Null 
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eindeutig bestimmt ist, folgt aus (4) die Gleichung (2) mit Fast-Sicher- 
heit. 

Definition 2. Es sei M eine Menge von Funktionen u,(£) von £, 
diese Funktionen heißen in ihrer Gesamtheit gegenseitig unabhängig, 
wenn die folgende Bedingung erfüllt ist: Es seien M’ und M’’ zwei dis- 
junkte Untermengen von M, A’ (bzw. A’) eine Menge aus %, welche 
durch eine Relation zwischen «, aus M’ (bzw. M’’) bestimmt ist; dann 


gilt die Gleichung ®) ( A’ 4") — Pp ( A’) p (4”) . 


Man könnte die Gesamtheit aller «, aus M’ (bzw. aus M’’) als Koordi- 
naten einer Funktion #’ (bzw. u’) betrachten. Die Definition 2 fordert 
nur die Unabhängigkeit von #’ und «’’ im Sinne der Definition 1 bei 
jeder Wahl teilfremder Mengen M’ und M”. 

Sind %,,4g,..., u, gegenseitig unabhängig, so ist immer 


m Plu, CA, 4WC As, ...,m CC Ay} 
= Pu, cA,)Pw,c4,)...PucA,); 


wenn nur die Mengen A, zu den entsprechenden %%* gehören (Beweis 
durch Induktion!). Diese Gleichung ist aber im allgemeinen keineswegs 
für die‘ gegenseitige Unabhängigkeit von %,,%g,...,u4, hinreichend. 

Man verallgemeinert (1) ohne Schwierigkeiten auf die abzählbaren 
Produkte. | 

Aus der gegenseitigen Unabhängigkeit von «,, in jeder endlichen 
Gruppe (%,,, Un» +++» %,) folgt im allgemeinen noch nicht, daß alle Un 
gegenseitig unabhängig sind. 

Man bemerkt endlich leicht, daß die gegenseitige Unabhängigkeit 
der Funktionen #, eigentlich eine Eigenschaft der entsprechenden Zer- 
legungen W,, ist. Sind ferner die «, eindeutige Funktionen der ent- 
sprechenden «,, so folgt aus der gegenseitigen Unabhängigkeit der «, 
diejenige von u. 


$ 2. Unabhängige zufällige Größen. 


Sind x], %g, :.., x, gegenseitig unabhängige zufällige Größen, so folgt 
aus der Gleichung (2) des vorigen Paragraphen insbesondere die Formel 


1) Fam.) (q,, 4, ...,4,) = F@%)(a,) Fe) (a,)... Fe) (a,). 


Wenn dabei der Mengenkörper % *» 2m) nur aus BoRELschen Mengen 
des R” besteht, so ist die Bedingung (1) für die gegenseitige Unabhängigkeit 
der Größen %,%g, :. .,%, auch hinreichend. 

Beweis. Es seien x’ = (%,,%,,...,%,) und x’= (RK Kanes Ku) 
zwei disjunkte Teilsysteme der Größen %,,%g,...,%,. Man soll auf 
Grund der Formel (1) beweisen, daß für je zwei BorELsche Mengen 4A’ 


und A’ des R* (bzw. R”) die Gleichung 
(2) PwcA, X" cA)=PlW”cA)P(x”c 4”) 
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erfüllt ist. Das folgt aus (1) unmittelbar für die Mengen von der Form 
A=l, <a, <4,..,%, <a, 
=, <br, <dg 2. Km << Dmpe 


Man beweist weiter, daß diese Eigenschaft der Mengen A’ und 4” 
bei der Differenz- und Summenbildung erhalten bleibt, woraus (2) 
für alle BorErschen Mengen folgt. 

Es sei jetzt x = {x,} eine beliebige (im allgemeinen unendliche) 
Gesamtheit zufälliger Größen. Ist der Mengenkörper 3” mit dem Körper 
B%M (M ist dabei die Menge aller u) identisch, so ist die Gesamtheit der 
Gleichungen 


(3) Fam... un (1 Qg3 -. 5 An) = Fu (Aı) Fur (@2) . . - Fun (an) 


für die gegenseitige Unabhängigkeit der Größen x, nolwendig und hin- 
reichend. | 

Die Notwendigkeit dieser Bedingung folgt unmittelbar aus der 
Formel (1). Wir wollen beweisen, daß sie auch hinreichend ist. Es 
seien M’ und M’” zwei disjunkte Untermengen der Menge M aller 
Indizes u, A’ (bzw. A’) eine Menge aus BY, welche durch eine Relation 
zwischen x, mit den Indizen # aus M’ (bzw. aus M’’) bestimmt ist; 
man soll beweisen, daß dann die Gleichung 
(4) P(A’A”) = P(A’) P(4A’) 
erfüllt ist. Sind A’ und A’ Zylindermengen, so handelt es sich in Wirk- 
lichkeit um Relationen zwischen endlichvielen Größen x,; die Glei- 
chung (4) ist in diesem Falle eine einfache Folge der früheren Betrach- 
tungen [Formel (2). Da aber die Relation (4) bei der Differenz- und 
Summenbildung der Mengen A’ (bzw. A’') erhalten bleibt, so ist (4) 
auch für alle Mengen aus BY“. bewiesen. 

Es sei jetzt für jedes # aus einer Menge M eine Verteilungsfunktion 
F (a) a priori gegeben, man kann dann ein solches Wahrscheinlichkeits- 
feld konstruieren, daß in diesem Felde gewisse zufällige Größen x, (u durch- 
läuft die ganze Menge M) gegenseitig unabhängig sein werden, wobei x, 
die a priori gegebene Funktion F„(a) als Verteilungsfunktion haben wird. 
Um das zu beweisen, genügt es, R“ als die Grundmenge E und BF“ 
als den Körper % zu wählen und die Verteilungsfunktionen F Kıllası. fin 
(vgl. drittes Kap., $4) durch die Gleichung (3) definieren. 

Es sei noch bemerkt, daß, wie man oben gesehen hat, aus der gegen- 
seitigen Unabhängigkeit jeder endlichen Gruppe von Größen x, 
[Gleichung (3)] die gegenseitige Unabhängigkeit aller x, auf BF folgt. 
In umfassenderen Wahrscheinlichkeitsfeldern kann diese Eigenschaft 
verlorengehen. 

Zum Schluß dieses Paragraphen geben wir noch einige Unabhängig- 
keitskriterien für zwei zufällige Größen: 
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Sind zwei zufällige Größen x und y gegenseitig unabhängig und ist 
E(x) ebenso wie E(y) endlich, so ist fast sicher 


E.(y) = Ey), 
E,(@)=E(). 
Diese Formeln bilden eine unmittelbare Folge der zweiten Definition 
der bedingten mathematischen Erwartung [Formeln (10) bis (11) des 


$ 4, fünftes Kap.]. Folglich sind im Falle der Unabhängigkeit die beiden 
Größen 


(5) 


R= Ey — E,(y))? gt — E[x — E,(z)]? 
oly) 0) 


gleich Null [wenn nur 0?(x) > 0 und o?(y) >0 ist]. Die Zahl f? heißt 
das Korrelationsverhältnis von y zu x, g? dasjenige von x zu y (PEARSON). 
Aus (5) folgt weiter, daß 


(6) E@Y)=ER@EN) 
ist. Zum Beweise wendet man die Formel (15) aus dem fünften Kapitel, 
$4 an: 
E(xy) =EE,(#y) = ERE,.y)] = EREW)] = EW)ER). 
Folglich ist im Unabhängigkeitsfalle 
‚_ Een) - E@EO) 
u 0° (7) 0°(y) 
auch gleich Null; r ist bekanntlich der Korrelationskoeffizient vonxundy. 


Genügen zwei zufällige Größen x und y der Gleichung (6), so heißen 
sie unkorrelieri. Für die Summe 


S=x,+%+ 4%, 
paarweise unkorrelierter Größen x, , %g, ..., %, berechnet man leicht, daß 
(7) 02(s) = 0?(%,) + 02(%,) +: + 0%.) 


ist. Die Gleichung (7) gilt also insbesondere für die unabhängigen 
Größen x;. 


8 3. Gesetz der großen Zahlen. 
Zufällige Größen s einer Folge 
Spy Sg #9 Sms > 
heißen stabil, wenn es eine solche Zahlenfolge 
A, Ag, -.., Ans »-» 
gibt, daß für jedes positive e 
Pin -4|> e} 
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mit n — oo gegen Null konvergiert. Wenn alle £ (s,) bestimmt sind und 
man 


d„ = E(s,) 


wählen kann, so ist die Stabilität normal. 
Sind alle s, gleichmäßig beschränkt, so folgt aus 


1) Pl» —-d|l>e}> 0 no 
die Relation 

IE(sn) — dn| > 0 n > +0 
und folglich 
(2) Pi, — E(n)]>E.}> 0. n— +oc 


Die Stabilität einer beschränkten stabilen Folge ist also notwendig 
normal. 
Es sei 
E(s, -- E(s,))? = 02(s,) = 0}. 


Nach der TCHEBYCHEFFschen Ungleichung ist 
Pin- E22. 

Folglich ist die MArKoFFsche Bedingung 
(3) 0, > 0 n> + 
für die normale Stabilität hinreichend. 

Sind s„ — E(s,) gleichmäßig beschränkt: 

|$n — E(m)| = M, 

so ist nach der Ungleichung (9) aus $3, viertes Kapitel 


_ o? — e? 
Pi» -Es)|ze}> np 
Folglich ist in diesem Falle die MARKoFFsche Bedingung (3) für die 
Stabilität von s, auch notwendig. 
Ist 
„-utrateeHhe 
nn n 
und die Größen x, paarweise unkorreliert, so hat man 


1 
= = 10° (X) to) + torl)}. 
Folglich ist in diesem Falle für die normale Stabilität der Mittelwerte s, 
die Bedingung 
(a = ra) + ra) +. + 026) = 0(m) 
hinreichend (Satz von TCHEBYCHEFF). Insbesondere ist die Bedingung 
(4) erfüllt, wenn alle Größen x, gleichmäßig beschränkt sind. 
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Man kann diesen Satz auf den Fall der schwach korrelierten Größen 
x, verallgemeinern: Setzt man voraus, daß der Korrelationskoeffizient 
Yan* von x, und x, der Ungleichung 
Imn z e(|n — m|) 
genügt und daß 


k=n-— 1 
C, = 20 (k) 
ist, so ist für die normale Stabilität der Mittelwerte s die Bedingung 
(5) Co = om) 
hinreichend!. 

Im Falle unabhängiger Summanden x, kann man auch eine not- 
wendige und hinreichende Bedingung für die Stabilität der Mittel- 
werte s„ geben. Für jedes x, existiert eine Konstante m, (Mediane von x,), 
die den folgenden Ungleichungen genügt: 


Pmn<m)=}, 


P„>m,) = 3. 

Wir setzen nun 
Kr %, wen |. —m|=n ist, 
Xnk = 0 im entgegengesetzten Falle, 

* Anıt Feat + Fan 
| s*— er, 
| N 
Dann sind die Relationen | 


(6) Pt %n — m. | > n} I Plus Fx)>0, n>+% 
-1 in k=1 
(7 0201) = I ot (inı) = 0(m) 


für die Stabilität der Größen s, notwendig und hinreichend?. 
Man kann dabei die Konstanten d, gleich den Größen E (sf) nehmen, 
so daß im Falle 
E(s2) — E(sn) > 0 | n>+% 


(und nur in diesem Falle) die Stabilität normal ist. 

Man erhält eine weitere Verallgemeinerung des TCHEBYCHEFFSchen 
Satzes, wenn man voraussetzt, daß s, irgendwie von den Ausgängen 
irgendwelcher » Versuche 


YA» Ars > An 


* Es ist offenbar immer r „= 1. 

ı Vgl. A. KHInTcHine: Sur la loi forte des grandes nombres, C. R. de l’acad. sci. 
Paris, Bd. 186 (1928) S. 285. | 

2 Vgl. A. KoLMOGOROFF: Über die Summen durch den Zufall bestimmter 
unabhängiger Größen. Math. Ann. Bd. 99 (1928) S. 309-319 — Berichtigungen 
ebenda Bd. 102 (1929) S. 484—488, Satz VIII (und der entsprechende Zusatz 
S. 318). 
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abhängt, so daß nach jedem bestimmten Ausgang aller dieser n Ver- 
suche s, einen bestimmten Wert erhält. Die allgemeine Idee aller Sätze, 
welche unter dem Namen des Gesetzes der großen Zahlen bekannt sind, be- 
steht darin, daß, wenn die Abhängigkeit der Größe s, bei einem großen 
n von jedem einzelnen Versuch X, (k=1,2,...,n) sehr klein ist, die 
Größen s, stabil sind. Betrachtet man 

Pr = ElEn.... u ($n) — En... u-ı (m) 


als ein vernünftiges Maß der Abhängigkeit der Größe s, von dem Ver- 
such X,, so läßt sich die obenerwähnte allgemeine Idee des Gesetzes 
der großen Zahlen durch die folgenden Betrachtungen konkretisieren!: 
Es sei 
Zur = En... ur (Sn) — Ey, 9... r-ı(Sn) - 
Dann ist 


Sn 7 E (s„) =, +2+''+2% 
E (2nx) = EEy,%... u (Sn) E Ey, 9... %-1(Sr) = E(s,) — E(s,) = 0, 
0% (213) = Elanı) = Par- 


Man berechnet weiter leicht, daß die zufälligen Größen 2,,,%=1,2,...,%, 
unkorreliert sind. Es sei in der Tat << %; dann ist? 


Er, ... AU-ı(lniZar) = Zi EU .:. Ur-ı (208) 
= 4 Eu... u-ı [En m... (Sn) — En... u (Sn) 


= Zni[En, u. U 1 (Sn) Ey, Mr... Ur ($n)] =0 


und folglich 
E (pin) = 0: 
Wir haben also 


0%(5) = (zn) + 9% lu2) + + 0% (zum) = Pnıt Paat + Pan 
Folglich ist die Bedingung 
Bitßet" +ßan>0 n— +0 


für die normale Stabilität der Größen s, hinreichend. 


$ 4. Bemerkungen zum Begriff der mathematischen 


Erwartung. 
Wir haben die mathematische Erwartung einer zufälligen Größe x als 
+00 
E(x) = [xP(dE) = |adF® (a) 
ea] 


ı Vgl. A. KoLMOGOROFF: Sur la loi des grands nombres. Rend. Accad. Lincei 
Bd. 9 (1929) S. 470— 474. 
2 Anwendung der Formel (15), fünftes Kapitel, $ 4. 
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definiert. Dabei versteht man rechts das Integral im Sinne 


+ c 


(1)  E(s) = [adF® (a) = im |@ dF® (a). FR oo 
Es liegt die Idee nahe, den Ausdruck 
+b 
(2) E*(x) = lim f adF® (a) b= oo 
= 


als die verallgemeinerte mathematische Erwartung zu betrachten. Man 
verliert dabei allerdings einige einfache Eigenschaften der mathemati- 
schen Erwartungen. Z.B. ist in diesem Falle die Formel 


Ex +y)=E() +EW) 


nicht mehr allgemeingültig. In dieser Form ist also die Verallgemeine- 
rung kaum zulässig. Es ist aber bemerkenswert, daß unter einigen ein- 
schränkenden Nebenvoraussetzungen die Definition (2) als eine ganz 
natürliche und brauchbare erscheint. 

Man kann nämlich die Frage folgendermaßen stellen: Es sei 


Ks Kay >: Ans 
eine Folge von gegenseitig unabhängigen Größen, welche dieselbe Ver- 
teilungsfunktion F®(a) = F@(a),n=1,2,..., haben wie x. Es sei 


weiter 
. Atratıt 
n N me 
Es wird gefragt, ob eine solche Konstante E*(x) existiert, daB bei 


jedem e>0 
(3) limP (|. — E*@)|) > e = 0 n— + 
ist. Die Antwort lautet: Existiert eine solche Konstante E* (x), so ist sie 
durch die Formel (2) dargestellt. Die notwendige und hinreichende Be- 
dingung für die Gültigkeit der Formel (3) besteht dabei aus der Existenz 
des Limes (2) und der Relation 

1 
(4) P(|x| >») = („)- 


Zum Beweise braucht man den Satz, daß die Bedingung (4) für die 
Stabilität der Mittelwerte s, notwendig und hinreichend ist, wobei im 
Falle der Stabilität 


+n 
d = [a AF® (a) 
_n 
gesetzt werden kann!. 


ı Vgl. A. KoLmoGoroFF: Bemerkungen zu meiner Arbeit ‚Über die Summen 
zufälliger Größen‘. Math. Ann. Bd. 102 (1929) S. 484—488, Satz XII. 
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Existiert die mathematische Erwartung im früheren Sinne [Formel 
(1)], so ist die Bedingung (4) immer erfüllt. Da in diesem Falle 
E(x) = E*(x) ist, so bestimmt die Forderung (3) wirklich eine Ver- 
allgemeinerung des Erwartungsbegriffes. Für die verallgemeinerte mathe- 
matische Erwartung bleiben die Eigenschaften I—-VII (viertes Kap., $ 2) 
erhalten, aus der Existenz von E*(x) folgt aber die Existenz von E*|x| 
im allgemeinen nicht. | | 

Um zu beweisen, daß der neue Erwartungsbegriff wirklich all- 
gemeiner ist als der frühere, genügt das folgende Beispiel: Man setzt 
die Wahrscheinlichkeitsdichte f®(a) gleich 


z — C [> 
(a) = ToFamlalr2)’ 


wobei die Konstante .C durch die Forderung 
+00 


jr» (@ da=1 


bestimmt ist. Man berechnet leicht, daß in diesem Falle die Bedingung 
(4) erfüllt ist, die Formel (3) den Wert 


E(x)=0 
ergibt, das Integral 


+00 +00 
[la] ar® (a) = [|a| /® (a) da 


aber divergent ist. 


$ 5. Starkes Gesetz der großen Zahlen, Konvergenz von 
Reihen. 
Zufällige Größen s, der Folge 
Sp> Sg + Ss eo 
sind stark stabil, wenn es eine solche Zahlenfolge 
A, Ans 2.5 Ans». - 
gibt, daß die zufälligen Größen 
Sn — A, 


mit n— +oo fast sicher gegen Null konvergieren. Aus der starken 
Stabilität folgt offenbar die gewöhnliche Stabilität. Wenn man 


An = E(s) 
wählen kann, so ist die starke Stabilität normal. 


1 Vgl. A. KOLMOGOROFF: Bemerkungen zu meiner Arbeit „Über die Summen 
zufälliger Größen“. Math. Ann. Bd. 102 (1929) S. 484—488, Satz XIII. 
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Im TCcHEBYCHEFFschen Falle 
start t 
=, 
wobei die Größen x, gegenseitig unabhängig sind, ist die Konvergenz 
der Reihe 00 
0? (%,) 
) up 
n=1 
für die starke normale Stabilität der Mittelwerte s, hinreichend!. Diese 
Bedingung ist in dem Sinne die beste, daß man für jede Reihe von 


Konstanten 5, mit oo 
bu 
Zm-te 
n=1 
eine Reihe von gegenseitig unabhängigen zufälligen Größen x, kon- 
struieren kann, so daß 
0? (%.) — Du 

ist und die entsprechenden Mittelwerte s, nicht stark stabil sind. 

Haben alle.x, dieselbe Verteilungsfunktion. F® (a), so ist die Existenz 
der mathematischen Erwartung 

+00 
E(x) = / adF@) (a) 

für die starke Stabilität von s, notwendig und hinreichend, die Stabilität 
ist in diesem Falle immer normal. 

Es seien jetzt wieder 

| Kr Kar ve, Anı ee» 
beliebige gegenseitig unabhängige zufällige Größen. Dann ist die Wahr- 
scheinlichkeit der Konvergenz der Reihe 
(1) 2 %n 

n=1 


entweder gleich Eins oder Null. Diese Wahrscheinlichkeit ist ins- 
besondere gleich Eins, wenn die beiden Reihen 


> E(%,) und >> 0? (x,) 


konvergent sind. Es sei weiter 
Y=%, imFalle |“,|=1, 
„)=0, imFallk |,.|>1 
1 Vgl. A. KoLMOGOROFF: Sur la loi forte des grandes nombres. C.R. Acad. 


Sci., Paris Bd. 191 (1930) S. 9140-911. 
2 Der Beweis ist noch nicht publiziert, 


Ergebnisse der Mathematik. 11/3. Kolmogoroff. 5 
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gesetzt. Dann ist die gleichzeitige Konvergenz der Reihen 


ZPtm|>1, DE) und o%(y,) 
n=1 n=1 n=1 


für die Konvergenz der Reihe (1) mit der Wahrscheinlichkeit Eins 
notwendig und hinreichend!. 


Anhang. 


Null- oder Eins-Gesetz 
in der Wahrscheinlichkeitsrechnung. 


Man hat schon mehrere Fälle beobachtet, in welchen gewisse Grenz- 
wahrscheinlichkeiten notwendigerweise gleich Null oder Eins sind. Zum 
Beispiel kann die Wahrscheinlichkeit der Konvergenz einer Reihe un- 
abhängiger zufälliger Größen nur diese zwei Werte annehmen?. Wir 
wollen jetzt einen allgemeinen Satz beweisen, welcher mehrere solche 
Fälle umfaßt. 

Satz. Es seien %,, &%g, -..,%,, ... irgendwelche zufällige Größen und 
M&1»%g».--,%n,...) eine BAırEsche Funktion? der Variablen x,,%,,..., 
%a,... derart, daß die bedingte Wahrscheinlichkeit 


P,.. 7 VIREN) uff (x) = 0} 
der Relation 


KK. Km...) = 0 


bei den bekannten » ersten Größen %,,%,,...,%, der absoluten Wahr- 
scheinlichkeit 


(1) Pi/(@) = 0} 


für jedes » gleich bleibt. Unter diesen Bedingungen ist die Wahr- 
scheinlichkeit (1) Null oder Eins. 

Insbesondere sind die Voraussetzungen des Satzes erfüllt, wenn 
alle Größen x, gegenseitig unabhängig sind und der Wert der Funk- 
tion f(x) bei einer’ Änderung von endlich vielen Größen &, unverändert 
bleibt. 


1 Vgl. A. KHINTCHINE u. A. KOLMOGOROFF: Über Konvergenz von Reihen. 
Rec. math. Soc. math. Moscou Bd. 32 (1925) S. 668—677. | 
% Vgl. Kap. VI, $ 5. Dasselbe gilt auch für die Wahrscheinlichkeit 


Pis, — d.>0} 
im starken Gesetz der großen Zahlen, wenigstens in dem Falle, daß die Größen x, 
gegenseitig unabhängig sind. 
3 Dabei versteht man unter einer BaırzEschen Funktion eine Funktion, welche 
ausgehend von Polynomen durch iterierte Grenzübergänge darstellbar ist. 
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Beweis des Satzes. Wir bezeichnen mit A das Ereignis 
I) =. 


Neben diesem Ereignisse betrachten wir den Körper $ aller Ereignisse, 
welche durch irgendwelche Relationen zwischen endlich vielen Größen x, 
bestimmt werden können. Gehört ein Ereignis B zu $, so ist wegen der 
Bedingungen des Satzes 


(2) Pz(A)=P(4). 
Im Falle P(4)=0 ist unser Satz schon bewiesen. Es sei also 
P(4)>0. Dann folgt aus (2) die Formel 


P,(A)P(B 
E en PB). 


P(B) und P,(B) sind also zwei vollständig additive Mengenfunktionen, 
welche auf $& zusammenfallen, sie müssen folglich auch für jede Menge 
der BoreLschen Erweiterung B& des Körpers & einander gleich bleiben. 
Insbesondere ist deswegen 


P(4)=P,(A)=1. 


Womit unser Satz bewiesen ist. | 

Einige weitere Fälle, in welchen man über gewisse Wahrscheinlich- 
keiten behaupten kann, daß sie nur die Werte Null und Eins annehmen 
können, wurden von P. Levy entdeckt. Vgl. dazu P. Levy: Sur un 
th&or&me de M. KHINTCHINE, Bull.desSc. Math. Bd. 55 (1931) S. 145—160, 
Theor&me II. | 
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